工作半年多的我

實驗室最近要聚餐了,老師要大家報告一下自己的工作
對於算是新鮮人的我們應該比較有可以說的東西
感覺之後再過三年還要再報告可能就會沒東西了
但想想如果真的沒東西可以說的話也是滿悲哀的
表示自己這三年都沒有甚麼變化或長進
居然沒有東西可以更新,頗可怕的

公司與職位

我現在的工作職稱是生物資訊工程師,生物資訊是個結合電腦科學跟生物學的學門
碩班的時候對統計方法跟GO、KEGG之類的功能註解分析覺得很有趣
而且蛋白質體這種數據又很適合用程式語言來處理,所以就去學生資相關的東西了

快畢業那時候就在想有沒有工作是可以結合農業跟生物資訊的
直到現在大部份看到其實都還是跟基因體定序分析相關的工作
而且都是些耳熟能詳的公司在徵人,去人力銀行打生物資訊應該就會看到了
不過後來我有去面試的公司也都不是這些傳統的生資工作

最後還真的去了一個跟農業跟生資結合的公司 益農
我們公司是做全基因體定序服務,定序的技術主要是第三代的Nanopore
不過定序也只是技術,主要重點是在於後續的分析服務
而服務的對象主要是跟農漁畜或環境工程相關的研究單位
目的是要協助客戶了解樣本中的微生物,進而增加生產效率
實際作法為萃取環境或動物體內的微生物DNA做定序分析

工作介紹

內容

實際上我的工作內容可以分成兩類,一個就是要用已經建立好的分析流程去分析客戶的樣本,然後輸出成報告,這部份相對簡單
目前的分析服務有:

  • 菌株鑑定: 客戶塗盤篩選出來的菌落鑑定與基因體資料庫中最接近的菌株
  • 基因註解: 組裝完的基因體預測基因位置以及其身份與功能
  • 功能預測: 透過內部的基因功能資料庫預測該菌種是否有感興趣的功能
  • 微生物總基因體: 鑑定metagenome中菌種的組成比例以其功能

另一部份是就是我工作的主軸-研發
大概又分成建造或優化吧

  • 建立新的分析項目:開發客戶所需要的分析服務,建立新的分析流程,不過開發需求這塊是產品專員的範疇,生資工程師這部份就是討論可行性然後執行
  • 優化分析流程:電腦跑資料的速度可以更快、分析的準確度更高或是獲取的資訊更多
  • 資料庫建立:簡單點就是整合公開的資料庫,像NCBI、KEGG之類的,難的就是建立內部用的資料庫
  • 演算法開發:這點也是工作的重點與主軸,以上的研發工作基礎都是建立於有一套分析的演算法

性質

生資工作的性質也可以分成使用工具和開發演算法
現在很多的生資工作都是跑pipeline產生報告給客戶
這樣的工作內容我自己覺得比較乏味,只有在一開始建立pipeline的時候會覺得有趣而已
等到建立完成,可以順利運行之後就會想要作其他開發類的項目了
pipeline其中包含很多程式在裏面,但充其量就只是使用而已
重點是要了解每個程式背後的演算法比較重要
然後如果有優化的可能的話就自己再開發新的工具或pipeline

還有一個重點是以前就知道的,但目前很多研究單位還是普遍有的觀念
就是覺得資料分析就是跑個軟體有東西出來就好了
但前面我說的工作內容很多都是在開發出更精準的演算法,為了得到更精準的結果
像是組裝reads就有這麼多種演算法,哪一種演算法才最適合自己的資料
或是要怎麼結合這些工具並優化流程才會是更精準的結果
說到序列比對大多都會先想到BLAST,雖然他有他適合使用的場合
但如果對於大量的reads比對就會是場災難
所以才會再去開發其他比對速度更快的演算法
我的工作就是在追求分析的結果是比常用的分析方法得到更多或更準確的結果

心ㄙㄨㄟ、得ㄋㄧㄢ、

前面在說生資的工作都是現在主流的基因體學
但生物資訊的定義是很廣的,凡是使用電腦來處理生物的數據的相關應用都可以算是生資
不過問以前的系上生資的老師動科系有啥生資相關的工作
這些都是需要軟硬體同時搭配,也就是物聯網的應用
但對於動科系的學生來說真的太過硬核了
那部份應該會是生機系出生的會比較得心應手
但也不是不可能掛足,也可從軟體方面下手,也就是純資料分析
或是現在有個叫樹莓派的小電腦很適合來玩,雖然我一直沒去玩就是了

以前在碩班的時候,有段時間莫名有種想創業的衝動
那時候還去參加學校辦的創業研習
發現到很多創業的項目都是賣一個實體的東西
不應該說很多,是全部都是在賣產品
我就在想說為何沒有像是針對某個產業做輔導或是顧問服務
賣的不是東西,而是服務和資訊
照理說這概念應該不是很新穎的東西了,可惜當時的老師們走向聽起來也是要有個東西來賣
現在回想起來那個研習會也都已經預設你已經有東西要來賣了才來參加比較好
不然就視聽完課就可以閃人了,真搞不懂當時為何還跟組員在那邊糾結要生出一個產品
回過頭來現在的公司的確就是在賣服務、賣給客戶資訊