-
大小: 16KB文件類型: .pl金幣: 1下載: 1 次發(fā)布日期: 2021-05-04
- 語言: 其他
- 標(biāo)簽: Perl??chenlianfu??Blast??
資源簡介
Usage:
/home/chenlianfu/chenlianfu_scripts/parsing_blast_result.pl [options] blast.out > blast.tab
對(duì)BLAST的xml或tab格式的結(jié)果進(jìn)行解析和過濾,得到更準(zhǔn)確的BLAST結(jié)果。結(jié)果為表格形式(BLAST outfmt6),結(jié)果按query序列的ID排序,每個(gè)query序列的比對(duì)結(jié)果按得分排序。
--type default: xml
設(shè)置輸入BLAST結(jié)果文件的類型。可以設(shè)置為xml或tab兩種類型。
若是tab格式,則BLAST結(jié)果中沒有query與subject的序列長度信息,默認(rèn)設(shè)置下無法使用--subject-coverage和--query-coverage參數(shù)的覆蓋率閾值對(duì)結(jié)果進(jìn)行過濾。在設(shè)置--db-subject輸入數(shù)據(jù)庫FASTA文件后可以使用--subject-coverage參數(shù)進(jìn)行過濾;在設(shè)置--db-query輸入query序列FASTA文件后可以使用--query-coverage參數(shù)進(jìn)行過濾。
若是xml格式,結(jié)果文件中包含query和subject長度信息,從而不需要使用--db-subject和--db-query參數(shù)輸入FASTA序列文件。
--no-header
添加該參數(shù)則不輸出表頭。
--max-hit-num default: 20
設(shè)置允許的最大hit數(shù)量。
--evalue default: 1e-5
設(shè)置HSP的evalue閾值。
--identity default: 0.05
設(shè)置HSP的identity閾值。
--CIP default: 0.2
設(shè)置cumulative identity percentage閾值(這里依然使用了比值,單位不是%,所以其值要設(shè)置不大于1,默認(rèn)值0.2表示20%閾值),對(duì)Hit進(jìn)行過濾。CIP = 所有HSPs的一致位點(diǎn)之和 / 所有HSPs的比對(duì)長度之和。
--subject-coverage default: 0.2
設(shè)置所有HSPs對(duì)subject序列總體的覆蓋率閾值。該參數(shù)閾值在文獻(xiàn)中也被稱為CALP(cumulative alignment length percentage),即 sum of all HSPs / subject length。
--db-subject
輸入數(shù)據(jù)庫的FASTA文件,以獲取subject序列長度信息。
--query-coverage default: 0.2
設(shè)置所有HSPs對(duì)query序列總體的覆蓋率閾值。該參數(shù)閾值在文獻(xiàn)中也被稱為CALP(cumulative alignment length percentage),即 sum of all HSPs / query length。
--db-query
輸入query序列的FASTA文件,以獲取query序列長度信息。
--percentage-of-top-bitscore default: 100
使用bitscore得分對(duì)hit進(jìn)行過濾,設(shè)置輸出hits的bitscore得分和最高得分相差不超過最高得分的百分?jǐn)?shù)。hit若有多個(gè)HSPs,則取最高的HSP得分作為hit的得分;若數(shù)據(jù)庫非常大,則推薦將設(shè)置該參數(shù)值設(shè)置為10,則能極大減少比對(duì)結(jié)果,保留最準(zhǔn)確的結(jié)果;若數(shù)據(jù)庫比較小,則推薦設(shè)置該參數(shù)值為50,或使用默認(rèn)值;使用該參數(shù)來減少比對(duì)結(jié)果,優(yōu)于僅使用最優(yōu)比對(duì)結(jié)果。
--HSP-num default: max
若一個(gè)hit有多個(gè)HSPs,該參數(shù)設(shè)置輸出得分指定數(shù)目個(gè)最高的HSPs。默認(rèn)輸出所有的HSPs。
--out-hit-confidence
添加該參數(shù),則在表格結(jié)果第13、14和15列分別輸出Hit的CIP、CALP_query、CALP_subject值。
--suject-annotation
若--type參數(shù)的值是xml,添加該參數(shù)可以生效,則額外增加最后一列suject annotation注釋結(jié)果。
代碼片段和文件信息
- 上一篇:使用flash播放mp4視頻
- 下一篇:ca碼生成(verilog)
評(píng)論
共有 條評(píng)論