Antepfıstığı Yeni Nesil Sekans Verilerinde Varyant Belirleme Aşamasında Duplike Okumaları Belirlemenin Etkisi

Harun KARCI, Salih KAFKAS

  •  Yıl : 2024
  •  Cilt : 4
  •  Sayı : 1
  •  Sayfa : 11-18
Antepfıstığı (Pistacia vera L.), Anacardiceae familyasının bir üyesi olup Pistacia cinsinin tek kültürel formudur. P. vera dioik bitki türlerinden biridir ve Pistacia cinsi içeridinde az sayıda da olsa hermafrodit ve monoik çiçek yapısına sahip genotipler bulunmuştur. Antepfıstığının ıslahı, dioik çiçek yapısı, gençlik döneminin oldukça uzun olması ve periyodisite göstermesi gibi birçok sınırlayıcı faktörden dolayı oldukça uzun sürmektedir. Yakın zamanda kromozom düzeyinde antepfıstığı genomları yayınlanmış ve genom büyüklüğü yaklaşık 600 Mb olarak bildirilmiştir. Bu çalışmada, Siirt çeşidine ait Yeni Nesil Dizileme (NGS) verileri kullanılarak varyant belirleme aşamasında duplike okumaları belirlemenin etkisini tespit etmek amacıyla birçok biyoinformatik analiz yapılmıştır. Kısa InDel’ler ve SNP’lerin tespiti için yaklaşık 5.2 Gb veri kullanılmıştır. Yüzde 99.83 haritalama oranı belirlenmiş ve yaklaşık 35 milyon okuma referans genoma başarıyla haritalanmıştır. Haritalama kalitesi ve okuma derinliği filtrelemeleri sırasıyla MQ>30 ve DP>2 olarak gerçekleştirilmiştir. Tüm okumaların yüzde 7.18’i duplike okumaları (2.50 milyon) oluşturmuştur. MarkDuplicates (MD) işlemi uygulanmayan BAM dosyası kullanılarak yapılan varyant belirleme analizinde toplam 1,022,161 SNP ve 124,762 InDel, MD işlemi gerçekleştirilen BAM dosyası kullanılarak yapılan varyant belirleme analizi sonrasında ise toplam 1,050,788 SNP ve 128,109 InDels tespit edilmiştir. Her iki VCF dosyası genom pozisyonlarına göre karşılaştırılmıştır. Aynı pozisyonlardaki aynı ve farklı (referans aleli aynı ancak farklı alternatif aleller) varyantlar saydırılmış ve ayrı ayrı kaydedilmiştir. Ayrıca MD işlemi yapılmayan BAM dosyasının varyant belirleme işlemlerinde, toplam 42,413 adet gerçek negatif lokus (TNL) kaybına ve toplam 10,439 adet yanlış pozitif lokus (FPL) elde edilmesine neden olmuştur. Sonuç olarak, MD tüm organizmalar için varyant belirleme analizlerinin önemli bir aşaması olmakla birlikte yanlış pozitif lokusların ortadan kaldırılması için de gerçekleştirilmelidir. Elde edilen bu sonuçların, gelecekte yapılacak ıslah programlarında varyant tespitinde faydalı olabileceği düşünülmektedir.
Atıf yapmak için : Karcı, H. & Kafkas, S. (2024). Impact of mark duplicate reads during variant calling in next generation sequencing (NGS) data of Pistacia vera L. Eregli Journal of Agricultural Sciences, 4(1), 11-18. https://doi.org/10.54498/ETBD.2024.29

Açıklama : Yazarların hiçbiri, bu makalede bahsedilen herhangi bir ürün, aygıt veya ilaç ile ilgili maddi çıkar ilişkisine sahip değildir. Araştırma, herhangi bir dış organizasyon tarafından desteklenmedi.Yazarlar çalışmanın birincil verilerine tam erişim izni vermek ve derginin talep ettiği takdirde verileri incelemesine izin vermeyi kabul etmektedirler. None of the authors, any product mentioned in this article, does not have a material interest in the device or drug. Research, not supported by any external organization. grant full access to the primary data and, if requested by the magazine they agree to allow the examination of data.
Antepfıstığı Yeni Nesil Sekans Verilerinde Varyant Belirleme Aşamasında Duplike Okumaları Belirlemenin Etkisi, Araştırma Makalesi,
, Vol. 4 (1)
Geliş Tarihi : 03.01.2024, Kabul Tarihi : 28.06.2024 , Yayın Tarihi : 28.06.2024
Ereğli Tarım Bilimleri Dergisi
ISSN: ;
E-ISSN: 2822-4167 ;
index index index