![]() |
利用NLP(Natural Language Processing)方法從PubMed文獻摘要數據庫中分析A基因調控網絡,并對互作的基因進行GO、pathway分析。
|
|||||||||||||||||
[發表評論] [本類其他服務] [本類其他服務商] |
服務商: 上海豐核信息科技有限公司 | 查看該公司所有服務 >> |
一、項目目標:
利用NLP(Natural Language Processing)方法從PubMed文獻摘要數據庫中分析A基因調控網絡,并對互作的基因進行GO、pathway分析。
用途:
基因-基因互作網絡、基因-蛋白互作網絡、基因-microRNA互作網絡、蛋白-蛋白互作網絡、microRNA-microRNA互作網絡。
二、項目方案
2.1.基本流程
1) 利用關鍵詞進行文檔搜索,并將文檔整理成XML格式。
2) 將摘要文本分離成單個句子。后續的分析是以句子為基本單位的。
3) 利用B軟件進行人類基因的描述的定位,提取基因。
4) 基因符號以NCBI的entrez gene數據庫為準。基因互作關系由B軟件繪制為網絡結構。
5) 建立一個基因互作的verb詞典,分離句子中基因互作的verb。
6) 生成A基因同義詞字典,分離句子中A基因的描述。
7) 統計分析基因名、互作verb和A基因同時出現(co-occurrence)的句子,整理列表。基因互作關系由某軟件繪制為網絡結構。
聯系我們:
上海總部:
網址:
電子郵箱:market@microsci.com
企業QQ:800068602
電話:4000-331-887
傳真:021-61268380轉8002
地址:上海市閔行區劍川路951號滄源科技園A樓102室
郵編:200241
淘寶地址:http://shop57095553.taobao.com
----聯系時,請注明信息來自“中國生物器材網”----
用手機“掃一掃”,更多學術資訊齊分享!