Rozdiel medzi podobnosťou a identitou pri zarovnávaní sekvencií

Obsah:

Rozdiel medzi podobnosťou a identitou pri zarovnávaní sekvencií
Rozdiel medzi podobnosťou a identitou pri zarovnávaní sekvencií

Video: Rozdiel medzi podobnosťou a identitou pri zarovnávaní sekvencií

Video: Rozdiel medzi podobnosťou a identitou pri zarovnávaní sekvencií
Video: Sequence similarity and identity 2024, Júl
Anonim

Kľúčový rozdiel medzi podobnosťou a identitou pri zarovnávaní sekvencií je ten, že podobnosť je podobnosť (podobnosť) medzi dvoma sekvenciami v porovnaní, zatiaľ čo identita je počet znakov, ktoré sa presne zhodujú medzi dvoma rôznymi sekvenciami.

Bioinformatika je interdisciplinárny vedný odbor, ktorý zahŕňa najmä molekulárnu biológiu a genetiku, informatiku, matematiku a štatistiku. Zoradenie sekvencií je hlavným pojmom v bioinformatike. Je to postup, pri ktorom sú sekvencie DNA, RNA alebo proteínu usporiadané tak, aby identifikovali oblasti podobnosti, čo je dôsledkom funkčného, štrukturálneho alebo evolučného vzťahu medzi sekvenciami. Na konci zarovnania budú prezentované ako riadky v matici. Aby bolo možné zarovnať identické znaky v postupných stĺpcoch, medzi zvyškami sú vložené medzery.

Čo je podobnosť?

Podobnosť v zarovnaní sekvencií je podobnosť medzi dvoma sekvenciami pri porovnaní. Táto skutočnosť závisí od identity sekvencií. Podobnosť znázorňuje rozsah, v akom sú zvyšky zarovnané. Preto podobné sekvencie obsahujú podobné vlastnosti. V bioinformatike je podobnosť nástrojom na posúdenie podobnosti medzi dvoma proteínmi.

Rozdiel medzi podobnosťou a identitou v zoradení sekvencií
Rozdiel medzi podobnosťou a identitou v zoradení sekvencií

Obrázok 01: Podobnosť v zarovnaní sekvencie

Pri procese zarovnávania sekvencií existujú dva hlavné kroky. Počiatočným krokom je párové zarovnanie, ktoré pomáha nájsť optimálne zarovnanie medzi dvoma sekvenciami (vrátane medzier) pomocou algoritmov, ako sú BLAST, FastA a LALIGN. Algoritmus zhody nájde minimálny počet editačných operácií; in-dels a substitúcie, aby sa zoradila jedna sekvencia s druhou sekvenciou. Po párovom zarovnaní je potrebné získať dva kvantitatívne parametre z každého párového porovnania. Sú to identita a podobnosť.

Čo je identita?

Identita v zarovnaní sekvencií je počet znakov, ktoré sa presne zhodujú medzi dvoma rôznymi sekvenciami. Preto sa medzery pri posudzovaní identity nepočítajú. Meranie sa považuje za vzťah ku kratšej sekvencii spomedzi dvoch sekvencií. Významne to znamená, že má účinok tam, kde sekvenčná identita nie je tranzitívna. Ak X=Y a Y=Z, potom X sa nemusí nevyhnutne rovnať Z. Toto je odvodené z hľadiska miery identity.

Kľúčový rozdiel – podobnosť vs identita v zoradení sekvencií
Kľúčový rozdiel – podobnosť vs identita v zoradení sekvencií

Obrázok 02: Identita v zarovnaní sekvencie

Napríklad X má sekvenciu AAGGCTT, Y má sekvenciu AAGGC a Z má sekvenciu AAGGCAT. Identita medzi X a Y je 100 % {5 identických nukleotidov / min [dĺžka (X), dĺžka (Y)]}. Identita medzi Y a Z je tiež 100%. Ale identita medzi X a Z je len 85 % {(6 identických nukleotidov / 7)}.

Aké sú podobnosti medzi podobnosťou a identitou pri zarovnávaní sekvencií?

  • Podobnosť aj identita sú dva pojmy, ktoré používame pri zoraďovaní sekvencií.
  • Tiež odkazujú na podobnosť medzi týmito dvoma sekvenciami.
  • Okrem toho ich vyjadrujeme ako percentuálnu hodnotu.

Aký je rozdiel medzi podobnosťou a identitou pri zarovnaní sekvencií?

Podobnosť v zarovnaní hovorí o podobnosti medzi dvoma sekvenciami pri porovnaní, zatiaľ čo identita v zoradení sekvencií hovorí o množstve znakov, ktoré sa presne zhodujú medzi dvoma rôznymi sekvenciami. Preto je toto kľúčový rozdiel medzi podobnosťou a identitou pri zarovnávaní sekvencií.

Rozdiel medzi podobnosťou a identitou v zarovnaní sekvencií - tabuľková forma
Rozdiel medzi podobnosťou a identitou v zarovnaní sekvencií - tabuľková forma

Súhrn – Podobnosť verzus identita v zarovnaní sekvencie

Zarovnanie sekvencií pomáha identifikovať oblasti podobnosti v DNA, RNA alebo proteínoch, ktoré sú výsledkom funkčného, štrukturálneho alebo evolučného vzťahu medzi sekvenciami. Podobnosť a identita sú teda dva kľúčové pojmy v kontexte zoraďovania sekvencií. Kľúčový rozdiel medzi týmito dvoma pojmami je v tom, že podobnosť je podobnosť medzi dvoma sekvenciami v porovnaní, zatiaľ čo identita je počet znakov, ktoré sa presne zhodujú medzi dvoma rôznymi sekvenciami. Toto je zhrnutie rozdielu medzi podobnosťou a identitou v zoradení sekvencií.

Odporúča: