注意:使用该工具前,请务必查看右侧示例数据格式,输入数据格式必需与示例数据格式一致,否则做不了!
必需输入:
请输入fasta格式数据:


功能选项
互补序列
反向序列
反向互补序列

DNA --> RNA
RNA --> DNA

序列全转成小写
序列全转成大写

仅输出名字
去掉gap

仅输出小于某长度的
请选择最大长度(默认-1,全部输出):
仅输出大于某长度的
请选择最小长度(默认-1,全部输出):

序列格式化输出
请选择每行多少个碱基(输入0,则序列仅占一行):

排序
根据名字排序(natural order)
根据序列长度排序(短->长)
根据序列长度排序(长->短)

shuffle序列
请选择shuffle的seed:

此工具将消耗 0 微币

常见fasta序列文件处理


FASTA格式(又称为Pearson格式)是一种基于文本的、用于表示核苷酸序列或氨基酸序列的格式。在这种格式中碱基对或氨基酸用单个字母来表示,且允许在序列前添加序列名及注释。第一行是由大于号">"开头的任意文字说明,用于序列标记,为了保证后续分析软件能够区分每条序列,单个序列的标识必须具有唯一性。 从第二行开始为序列本身,只允许使用既定的核苷酸或氨基酸编码符号。通常核苷酸符号大小写均可,而氨基酸常用大写字母。使用时应注意有些程序对大小写有明确要求。文件每行的字母一般不应超过80个字符。可以仅包含一条序列,也可以包含多条序列。
本程序调用seqkit软件处理,参考:https://bioinf.shenwei.me/seqkit/
输入
>ENSMUSG00000020122
CCCTCCTATCATGCTGTCAGTGTATCTCTAAATAGCACTCTCAACCCCCGTGAACTTGGT
TATTAAAAACATGCCCAAAGTCTGGGAGCCAGGGCTGCAGGGAAATACCACAGCCTCAGT
TCATCAAAACAGTTCATTGCCCAAAATGTTCTCAGCTGCAGCTTTCATGAGGTAACTCCA
GGGCCCACCTGTTCTCTGGT
>ENSMUSG00000020123
GAGTCAGGTTGAAGCTGCCCTGAACACTACAGAGAAGAGAGGCCTTGGTGTCCTGTTGTC
TCCAGAACCCCAATATGTCTTGTGAAGGGCACACAACCCCTCAAAGGGGTGTCACTTCTT
CTGATCACTTTTGTTACTGTTTACTAACTGATCCTATGAATCACTGTGTCTTCTCAGAGG
CCGTGAACCACGTCTGCAAT
输出 fasta基本统计信息。
根据不同的功能类型,输出不同的结果

如何引用?

建议直接写网址。4200+篇google学术,3500+篇知网学术
正式引用:Tang D, Chen M, Huang X, Zhang G, Zeng L, Zhang G, Wu S, Wang Y.SRplot: A free online platform for data visualization and graphing. PLoS One. 2023 Nov 9;18(11):e0294236. doi: 10.1371/journal.pone.0294236. PMID: 37943830.
方法章节:Heatmap was plotted by https://www.bioinformatics.com.cn (last accessed on 10 Oct 2024), an online platform for data analysis and visualization.
致谢章节:We thank Mingjie Chen (Shanghai NewCore Biotechnology Co., Ltd.) for providing data analysis and visualization support.