Aký je rozdiel medzi FASTA a FASTQ

Obsah:

Aký je rozdiel medzi FASTA a FASTQ
Aký je rozdiel medzi FASTA a FASTQ

Video: Aký je rozdiel medzi FASTA a FASTQ

Video: Aký je rozdiel medzi FASTA a FASTQ
Video: Самый простой способ выровнять пол! Быстро, Дешево, Надежно. ENG SUB 2024, Júl
Anonim

Kľúčový rozdiel medzi FASTA a FASTQ je v tom, že FASTA je textový formát, ktorý ukladá iba nukleotidové alebo proteínové sekvencie, zatiaľ čo FASTQ je textový formát, ktorý ukladá hodnoty kvality sekvencie aj súvisiacej sekvencie.

Bioinformatika je oblasť, ktorá využíva odlišný softvér na analýzu a pochopenie biologických údajov, najmä ak je súbor údajov zložitý a veľký. Táto oblasť spája biológiu, chémiu, fyziku, informatiku, informačné inžinierstvo, matematiku a štatistiku na analýzu a interpretáciu biologických údajov. FASTA a FASTQ sú dva formáty reprezentácie sekvencií v oblasti bioinformatiky na porovnanie a analýzu sekvencií. FASTQ je v skutočnosti formát sekvenčného súboru, ktorý rozširuje formát FASTA o možnosť uložiť kvalitu sekvencie.

Čo je FASTA?

FASTA je softvér na zarovnanie sekvencií DNA a proteínov. Softvér FASTA používa formát FASTA. Je to textový formát, ktorý predstavuje buď nukleotidové sekvencie alebo aminokyselinové (proteínové) sekvencie. Tu jednopísmenové kódy predstavujú obe tieto sekvencie. FASTA je dôležitým nástrojom v oblasti bioinformatiky a biochémie. Tento formát umožňuje, aby názvy sekvencií a komentáre predchádzali sekvenciám.

FASTA vs FASTQ v tabuľkovej forme
FASTA vs FASTQ v tabuľkovej forme

Obrázok 01: Sekvencia FASTA

Tento formát vznikol zo softvéru FASTA a zaviedli ho David J. Lipmann a William R. Pearson v roku 1985. Nástroj FASTA prešiel postupom času mnohými modifikáciami a najnovšia verzia pozostáva z programov pre proteín:proteín, DNA:DNA, proteín:preložená DNA (s posunom rámcov) a vyhľadávanie usporiadaných alebo neusporiadaných peptidov. FASTA číta danú nukleotidovú alebo aminokyselinovú sekvenciu a hľadá zodpovedajúcu sekvenčnú databázu pomocou lokálneho zarovnania sekvencií na nájdenie zhôd podobných databázových sekvencií.

Čo je FASTQ?

FASTQ je zoraďovací softvér používaný v oblasti bioinformatiky, ktorý uchováva biologickú sekvenciu (zvyčajne nukleotidovú sekvenciu) a jej zodpovedajúce skóre kvality. FASTQ bol pôvodne vyvinutý na spojenie sekvencie vo formáte FASTA a súvisiacich údajov o kvalite od Wellcome Trust Sanger Institute. S rozvojom v oblasti bioinformatiky sa FASTQ stal de facto štandardom pre ukladanie výstupu mnohých vysokovýkonných sekvenčných nástrojov.

Formát FASTQ používa štyri rôzne riadky na sekvenciu. Riadok 1 začína znakom @ a za ním nasleduje identifikátor sekvencie (podobne ako riadok názvu FASTA). Riadok 2 sa skladá zo surových sekvenčných písmen. V riadku 3 sa sekvencia začína znakom „+“a voliteľne za ňou nasleduje rovnaký identifikátor sekvencie. Riadok 4 kóduje hodnoty kvality pre sekvenciu v riadku 2 a mal by pozostávať z rovnakého počtu symbolov ako písmen v sekvencii.

Aké sú podobnosti medzi FASTA a FASTQ?

  • FASTA a FASTQ sú nástroje na zarovnanie.
  • Sú to dva formáty reprezentácie sekvencie.
  • Obe súvisia s oblasťou bioinformatiky.
  • FAST aj FASTQ sú dôležité nástroje na účely ukladania a sekvenovania.
  • FASTQ je rozšírenie formátu FASTA s možnosťou uloženia kvality sekvencie.

Aký je rozdiel medzi FASTA a FASTQ?

FASTA je textový formát, ktorý ukladá iba nukleotidové alebo proteínové sekvencie, zatiaľ čo FASTQ je textový formát, ktorý ukladá hodnoty kvality sekvencie aj súvisiacej sekvencie. Toto je kľúčový rozdiel medzi FASTA a FASTQ. Okrem toho FASTA ukladá sekvenčné fragmenty po mapovaní, zatiaľ čo FASTQ ukladá sekvenčné fragmenty pred mapovaním. Okrem toho, ďalší rozdiel medzi FASTA a FASTQ je ten, že FASTA pozostáva z jedného riadku popisu a FASTAQ pozostáva zo štyroch riadkov.

Nižšie uvedená infografika predstavuje rozdiely medzi FASTA a FASTQ vo forme tabuľky na porovnanie vedľa seba.

Zhrnutie – FASTA vs FASTQ

Bioinformatika používa rôzne formáty sekvencií ako FASTA a FASTQ atď. FASTA ukladá sekvenčné fragmenty po zmapovaní, zatiaľ čo FASTQ ukladá sekvenčné fragmenty pred mapovaním. FASTA je softvér na porovnanie DNA a proteínovej sekvencie. Pozostáva z programov pre proteín:proteín, DNA:DNA, proteín:preložená DNA (s posunom rámcov) a zoradené alebo neusporiadané vyhľadávanie peptidov. FASTQ je zoraďovací softvér používaný v oblasti bioinformatiky a uchováva biologickú sekvenciu (zvyčajne nukleotidovú sekvenciu) a jej zodpovedajúce skóre kvality. FASTA pozostáva z jedného riadku popisu a FASTQ pozostáva zo štyroch riadkov. Toto sumarizuje rozdiel medzi FASTA a FASTQ.

Odporúča: