申請/專利權人:青島興牧畜牧科技發展有限公司
申請日:2022-12-09
公開(公告)日:2023-01-06
公開(公告)號:CN115579066A
主分類號:G16B40/00
分類號:G16B40/00;G16B30/10;G06N3/04;G06N3/08
優先權:
專利狀態碼:在審-公開
法律狀態:2023.01.06#公開
摘要:本發明涉及生物信息學領域,具體為一種基于機器學習尋找影響豬脂肪沉積的候選基因的方法,主要包括以下步驟:步驟一:收集豬肌肉樣本,通過FOSS機測定肌內脂肪含量,作為樣本標簽,根據肌內脂肪含量大小分為高低組轉化為二分類處理問題;步驟二:提取樣本RNA,進行mRNA建庫得到測序數據;步驟三:對步驟二中的測序數據進行質控和比對處理,并標準化得到樣本基因表達TPM值;步驟四:利用數據集通過交叉驗證的方式進行神經網絡機器學習訓練;步驟五:對特征基因進行重要性排序從而確定候選基因。有益效果為,通過模型預測準確性的變化篩選影響肌內脂肪含量的重要候選基因。
主權項:1.一種基于機器學習尋找影響豬脂肪沉積的候選基因的方法,主要包括以下步驟:步驟一:收集豬肌肉樣本,通過FOSS機測定肌內脂肪含量,作為樣本標簽,根據肌內脂肪含量大小分為高低組轉化為二分類處理問題;步驟二:提取樣本RNA,進行mRNA建庫得到測序數據;步驟三:對步驟二中的測序數據進行質控和比對處理得到基因的count值,所述count值為比對到的reads數,并標準化得到樣本基因表達TPM值;所述TPM值計算公式為: 上述公式中各字母的含義: :比對到基因上的read數,即基因的count值; :基因的外顯子長度的總和,根據參考基因組SusSscrofa11.1的注釋計算; :所有基因比對read數和其外顯子長度總和之比的和;將基因表達TPM值作為樣本特征,并設置與樣本特征一一對應的標簽值,將樣本特征和標簽值構建成數據集;步驟四:利用數據集通過交叉驗證的方式進行神經網絡機器學習訓練;步驟五:基于PermutationImportance的方法計算神經網絡模型特征的重要性。
全文數據:
權利要求:
百度查詢: 青島興牧畜牧科技發展有限公司 基于機器學習尋找影響豬脂肪沉積的候選基因的方法
免責聲明
1、本報告根據公開、合法渠道獲得相關數據和信息,力求客觀、公正,但并不保證數據的最終完整性和準確性。
2、報告中的分析和結論僅反映本公司于發布本報告當日的職業理解,僅供參考使用,不能作為本公司承擔任何法律責任的依據或者憑證。