معلومة

ما الأداة التي يجب استخدامها لتعيين القراءات (samtools ، Sequencher ، ...)؟


أنا مبتدئ في المعلوماتية الحيوية. لدي 4 ملفات:

2 ملف fastq (aln1.fastq و aln2.fastq)

2 ملف بام (aln.bam و aln.bam.bai)

وأنا أعلم ذلك:

  • يتم محاذاة الملف الخام مع الجينوم البشري hg19.
  • الملف المتسلسل هو زوج من منصة التسلسل Miseq.
  • هذا الملف هو نتيجة تصميم تسلسل amplicon.

لدي أيضًا معلومات متسلسلة حول الاشعال (4 أمامي و 4 خلفي) و 2 محولات.

وعلي أن أجيب على هذين السؤالين:

  1. ما هو دستور كل قراءة ، على سبيل المثال (محول + تمهيدي + منطقة مكبرة)؟
  2. ما المنطقة الجينية التي تم تعيين تلك القراءات لها؟

سؤالي هو ما نوع الأداة التي يجب أن أستخدمها للرد على هذه الأسئلة؟ سامتولس؟ متسلل؟ FastQC؟ هل يمكن لأي شخص أن يساعدني فقط في البداية لأنني ضائع تمامًا.

شكرا


الaln.bamمن المحتمل أن يكون الملف إصدارًا ثنائيًا ومضغوطًا من ملف بتنسيق SAM ، مما يشير إلى مكان محاذاة القراءات. أعتقد أنه تم إنشاؤه بواسطة بعض برامج المحاذاة باستخدام ملفي fastq.

كبداية ، قد تستخدم برنامجًا لتصور مكان تعيين القراءات.

على سبيل المثال ، يمكنك استخدام IGV وتحميل ملفaln.bamملف لمعرفة مكان محاذاته في hg19. IGV سيستخدم أيضًا امتداد الملفaln.bam.baiملف لمساعدته في العثور على القراءات المحاذية في ملفaln.bamملف.

بقدر ما أعرف ، يتم استخدام Sequencher لتنظيف وتجميع بيانات تسلسل Sanger ، لكن تجربتي مع هذا البرنامج عمرها 10 سنوات تقريبًا.

Samtools هو برنامج سطر أوامر يمكنه مساعدتك في استخراج المعلومات من ملف aln.bam. يمكنك استخدامه لحساب عدد المحاذاة الموجودة في منطقة جينومية معينة ، على سبيل المثال ، باستخدام الخيارمنعرض samtools. راجع الدليل لمزيد من التفاصيل: http://www.htslib.org/doc/samtools.html


Samtools ليس تقويمًا ؛ يتم استخدامه لتحليل المحاذاة. FastQC لتحليل صفات القراءة والتكوين المتوسط. يمكنك التعرف على تسلسل المحول عن طريق تشغيل FastQC.

الخطوة التالية هي قطع المحول. هناك العديد من الأدوات التي تقوم بذلك. Trimmomatic تحظى بشعبية حاليًا. يمكنك العثور على تكوين المحول لكل قراءة عن طريق طرح طول القراءة بعد الاقتطاع من طول القراءة قبل القطع (سيكون هذا هو نفسه لجميع القراءات).

ثم يتعين عليك محاذاة القراءات المقتطعة إلى مرجع باستخدام التقويم. مرة أخرى ، هناك العديد من التقويمات المتاحة ؛ Bowtie ، STAR والآن واحدة جديدة تسمى HISAT. STAR و HISAT أسرع من Bowtie.

نظرًا لأن لديك بالفعل محاذاة (aln.bam) إلى hg19 ، فلن تحتاج إلى إجراء المحاذاة. تريد أن تعرف ، إلى أي الجينات تقوم هذه القراءات بالتعيين. هذه المعلومات غير متاحة ما لم يكن لديك تعليقات الجينوم التوضيحية. التعليقات التوضيحية متوفرة في شكل GTF / GFF الملفات. يمكنك الحصول على الارتباط بين مواقع الجينوم والقراءات باستخدامسريرمجموعة الأدوات كما هو مذكور في منشور Biostars هذا.

ليس لدي خبرة كبيرة في هذه الأداة. ما سأفعله هو تحويل ملفبامإلىسام(باستخدام samtools) أوسرير(باستخدام bedtools: bamtobed) وتحليل أعمدةسام/سريرملف يصف مواقع القراءة بامتدادGTFملف. انظر هذا الارتباط للحصول على تفاصيل حول تنسيق SAM. يمكنك استخدام أي لغة برمجة مثلawkأوبيرللتحليل.

Samtools لديها خيار منقي يقرأ وفقًا للمناطق المحددة فيسريرتنسيق ولكنه لن يقوم تلقائيًا بالتعليق عليها.

طريقة عرض samtools -hL areas.bed aln.bam> aln_filtered.sam

تحليل SNP

يمثل فحص ملايين القراءات التي ينتجها تسلسل الجيل التالي تحديًا كبيرًا عند البحث عن SNPs المرشحة. تتضمن كل من خوارزميات Maq و GSNAP إمكانات فحص SNP.

يحتوي Maq (1) على عملية فحص ذات مستويين والتي تبحث في البداية عن الاختلافات بين القراءات والتسلسل المرجعي. بعد ذلك ، يتم إجراء خطوة التصفية التي تغربل النتائج الأولية بحثًا عن الحد الأدنى من المتغيرات من نفس الفئة لكل عمود من القراءات ، والمتغيرات المضمنة في مناطق عالية الجودة. يتم عرض النتائج في تقرير شامل. يمكنك أيضًا عرض نتائجك في Maqview أو Tablet.

باستخدام GSNAP (2) ، يتخذ تحليل SNP نهجًا مختلفًا بالنظر إلى كل من SNPs التي تم الإبلاغ عنها مسبقًا وكذلك المرشحين الجدد. يجب على المستخدم تقديم قائمة من SNPs المعروفة بالإضافة إلى القراءات والتسلسل المرجعي. ينفذ GSNAP محاذاة متسامحة مع SNP لجميع الأليلات الرئيسية والثانوية. تمكن الخوارزمية من التمييز بين الأليلات الصغرى وعدم التطابق. يتم عرض النتائج في تقرير شامل. يمكنك أيضًا عرض نتائجك في الجهاز اللوحي.

(1) هنغ لي وجو روان وريتشارد دوربين
يقرأ تعيين تسلسل الحمض النووي القصير واستدعاء المتغيرات باستخدام تعيين درجات الجودة
أبحاث الجينوم 2008 18: 1851-1858

(2) توماس دي وو وسربان ناكو
الكشف السريع والمتسامح مع SNP للمتغيرات المعقدة والربط في قراءات قصيرة
المعلوماتية الحيوية 2010 26: 873-881


Samtools & amp ؛ عارض الجينوم المتكامل

سيقوم Samtools بتحويل ملفات .sam التي تم إنشاؤها في الخطوات السابقة إلى ملفات .bam. يقدم هذا الموقع إرشادات خطوة بخطوة للتحويل من sam إلى bam وفرز ملف .bam وفهرسته.

طريقة واحدة لتصور القراءات في ملف .bam هي IGV من Broad. لن أخوض في التفاصيل ، لكن الفكرة هي:

  1. اختر نفس الجينوم المرجعي الذي استخدمته لفهرسة الجينوم المرجعي من الخطوات السابقة.
  2. قم بتحميل ملف .bam الخاص بك (يجب أن يكون ملف الفهرس & # 8220.bai & # 8221 في نفس المجلد مثل .bam الذي تحمّله)
  3. اكتب الجين الذي تريده في شريط البحث.
  4. قم بالتكبير لرؤية القراءات ، فهي & # 8217t مرئية عند انخفاض الطاقة.

يتم إعداد كل كمبيوتر بشكل مختلف قليلاً عن استدعاء استخدامات ومكالمات مختلفة للبرنامج. نرحب بالتعليقات والاقتراحات!


تم تثبيت برنامج تعليمي حول العمل مع AppleScript وبعض نماذج نصوص AppleScript البرمجية مع Sequencher ، وهي متوفرة أيضًا على موقع الويب هذا. يمنحك البرنامج التعليمي والنصوص لمحة عن إمكانات AppleScript وكيف يمكن أن تساعدك في الحصول على المزيد من Sequencher. انقر هنا لتنزيل نماذج AppleScript.

اعتبارًا من شتاء 2006 ، توزع Gene Codes مفاتيح SuperPro باللون الأخضر والأزرق والأصفر. لن نقوم بشحن Purple Eve3 ومفتاح Red SuperPro بعد الآن.

مفتاح وظيفة البرمجيات المدعومة
أخضر أو ​​أسود بخط أخضر مفتاح الشبكة SuperPro Sequencher License Server 6.1 وما فوق
أزرق أو أسود بخط أزرق مفتاح SuperPro مستقل Mac Sequencher 4.7 وما فوق
أصفر أو أسود مع شريط أصفر مفتاح SuperPro مستقل Windows Sequencher 4.0 وما فوق
التسمية الحمراء NW مفتاح الشبكة SuperPro خادم ترخيص Windows Sequencher 5.2 وما بعده
تسمية NW الأرجواني مفتاح شبكة Eve3 خادم ترخيص Mac Sequencher 5.2 إلى 6.0.3
تسمية أرجوانية SA مفتاح Eve3 المستقل Mac Sequencher 3.1 إلى 4.7


نتائج ومناقشة

استخدام bio-samtools: برنامج تعليمي موجز

تعد bio-samtools قيد الاستخدام واضحة ومباشرة ، فيما يلي بعض الأمثلة على التفاعل مع ملفات BAM مع الحزمة. يتم توفير مزيد من المعلومات حول وظائف محددة في وثائق RubyDoc وفي الملفات bioruby-samtools / doc / tutorial.html و bioruby-samtools / doc / tutorial.pdf. يمكن العثور على موقع مجلد تثبيت bio-samtools عن طريق كتابة "gem which bio-samtools" في سطر الأوامر.

التركيب

يتم تثبيت bio-samtools بسهولة من جهاز متصل بالإنترنت وتثبيت Ruby مع استدعاء جوهرة مباشر "تثبيت bio-samtools". تقوم bio-samtools تلقائيًا بتنزيل شفرة مصدر libbam C الأصلية وتجميعها لنظام التشغيل Linux أو OSX بالشكل المناسب. يتم الاحتفاظ بالإصدار الجديد من المكتبة محليًا في كود bio-samtools لتجنب التعارض مع عمليات التثبيت الأخرى للمكتبة.

تحميل ملف BAM

يمثل كائن SAM المحاذاة في ملف BAM ، وهو سهل جدًا في الإنشاء ، وستحتاج إلى ملف BAM تم فرزه للوصول إلى المحاذاة وتسلسل مرجعي بتنسيق FASTA لاستخدام التسلسل المرجعي. يمكن إنشاء الكائن وفتحه على النحو التالي: يتطلب 'bio-samtools' bam = Bio :: DB :: Sam.new (: bam = & gt "my_sorted.bam"،: fasta = & gt'ref.fasta ') بام. فتح بام

يجب أن يتم فتح الملف مرة واحدة فقط لإجراء عمليات متعددة عليه ، ويكون الوصول إلى المحاذاة عشوائيًا لذلك لا تحتاج إلى تكرار جميع الإدخالات في الملف ، كما تفعل مع تحليل ملف SAM يدويًا.

الحصول على معلومات موجزة

يمكن الحصول على طول التسلسلات المرجعية وعدد القراءات المعينة لكل منها باستخدام دالة index_stats. يتم إرجاع كائن Hash ، يتم ترميزه بواسطة اسم المرجع وبواسطة Hash في كل قيمة. تحتوي التجزئة الموجودة على القيمة على المفاتيح: length ، و: mapped_reads و: unmapped_reads وقيم كل منها. تلتف الدالة index_stats الأمر SAMtools idxstats. sam.index_stats # إرجاع <"chr_1" = & gt <: length = & gt69930،: mapped_reads = & gt1000،: unmapped_reads = & gt0>،>

استرجاع التسلسل المرجعي

لا يمكن استرجاع المرجع إلا إذا تم تحميل المرجع ، وهذا لا يتم تلقائيًا من أجل حفظ الذاكرة. يجب تحميل المرجع مرة واحدة فقط ، ويتم الوصول إليه باستخدام اسم المرجع ، والبدء ، والنهاية في إحداثيات تستند إلى 1. تم إرجاع كائن سلسلة روبي القياسي. في هذا المثال ، يتم إرجاع منطقة 500 نيوكليوتيد من بداية التسلسل. bam.load_reference seq = bam.fetch_reference ("Chr1"، 1، 500)

استرداد المحاذاة في منطقة

يمكن الحصول على المحاذاة في منطقة الاهتمام واحدة تلو الأخرى عن طريق إعطاء المنطقة إلى وظيفة fetch (). bam.fetch ("Chr1"، 3000، 4000). كل منهما | محاذاة | يضع alignment.qname #do شيء بنهاية كائن المحاذاة

احصل على ملخص للتغطية في المنطقة

من السهل الحصول على العمق الكلي للقراءات في موضع معين ، يتم استخدام وظيفة chromosome_coverage. هذا يختلف عن الوظائف السابقة حيث يتم تمرير موضع البداية والطول (بدلاً من موضع النهاية) إلى الوظيفة. يتم إرجاع مجموعة من التغطيات ، على سبيل المثال [26،26،27 ..]. يعطي الموضع الأول في المصفوفة عمق التغطية عند موضع البداية المحدد في الجينوم ، ويعطي الموضع الأخير في المصفوفة عمق التغطية عند موضع البداية المحدد بالإضافة إلى الطول المحدد. التغطية = bam.chromosome_coverage ("Chr1"، 3000، 1000) وبالمثل ، يمكن استرجاع متوسط ​​التغطية (المتوسط ​​الحسابي) ، أيضًا مع معلمات البداية والطول av_cov = bam.average_coverage ("Chr1" ، 3000 ، 1000)

الحصول على المعلومات المتراكمة

يمثل تنسيق Pileup تغطية القراءات على قاعدة واحدة في المرجع. الحصول على Pileup فوق منطقة أمر سهل للغاية. لاحظ أن هذا يتم باستخدام mpileup وليس مع وظيفة pileup SAMTools التي تم إهمالها وإزالتها الآن. يؤدي استدعاء طريقة mpileup إلى إنشاء مكرر ينتج كائن Pileup لكل قاعدة. bam.mpileup do | pileup | يضع نهاية pileup.consensus

تأخذ وظيفة mpileup نطاقًا من المعلمات للسماح بتصفية مستوى SAMTools للقراءات والمحاذاة. يتم تحديدها كأزواج مفتاح ، قيمة. في هذا المثال ، يتم تحديد المنطقة بواسطة: r ويتم تحديد الحد الأدنى لكل درجة جودة أساسية بواسطة: Q. bam.mpileup (: r = & gt "Chr1: 1000-2000" ،: Q = & gt 50) do | pileup | يضع نهاية pileup.coverage

لا يتم دعم جميع الخيارات التي تسمح لك SAMTools بالمرور إلى mpileup ، ويتم تجاهل تلك التي تتسبب في إرجاع mpileup لتنسيق استدعاء المتغير الثنائي (BCF) [13]. على وجه التحديد ، هذه هي g ، u ، e ، h ، I ، L ، o ، p. يسرد الجدول 4 علامات SAMTools المدعومة والرموز التي يمكنك استخدامها لاستدعائها في الأمر mpileup.


كيف تستخرج قراءات لا مثيل لها باستخدام bwa و samtools؟

لدي قراءة واحدة (لا تقرن) أنني بحاجة إلى المرور عبر سير العمل الموضح في Beauclair et al. ورقة (نسخة مجانية هنا https://rnajournal.cshlp.org/content/24/10/1285.long) لتحديد الجينومات المعيبة باستخدام برنامج DI-tector الخاص بهم.

هنا في المواد والطرق ، يتم وصف الإجراء على النحو التالي:

تتكون الخطوة الأولى من سير العمل من محاذاة القراءات مقابل جينوم المضيف (الشكل 2i). تهدف هذه الخطوة إلى التخلص من تلك الخريطة إلى الجينوم المضيف وقد يتم تعيينها جزئيًا إلى الجينوم الفيروسي بعد التجزئة ، وتقليل حجم ملف العمل. على سبيل المثال ، تم إنشاء مجموعات بيانات MV و rMV-V من إجمالي عينات الحمض النووي الريبي للخلايا المصابة واحتوت في الغالب على قراءات ترسم خرائط الجينوم البشري (≈99٪). تستخدم هذه الخطوة مجموعة من طريقة عرض bwa mem و samtools مع المعلمات –bS –f4. تتكون خطوة إضافية من محاذاة القراءات مقابل الجينوم الفيروسي محل الاهتمام ، من أجل استبعاد القراءات التي ترسم خرائط الجينوم الفيروسي تمامًا. لذلك ، يتم تحليل القراءات غير المعينة فقط. من الجدير بالملاحظة ، يتم أيضًا حفظ القراءات المقطوعة (على سبيل المثال ، نموذج CIGAR يحتوي على S أو H). قد ترتبط بعض هذه القراءات بوصلات إعادة تركيب الجينوم الفيروسي الموجودة في جينومات DI.

لقد اقترحت بالفعل استخدام bowtie2 بدلاً من bwa ، لكن أولاً ، الإخراج غير واضح بالنسبة لي وثانيًا ، أود اختبار البروتوكول الرسمي.

نظرًا لأن المقالة تقترح استخدام bwa و samtools في هذه الخطوة الأولى ، فهذا ما فعلته حتى الآن:

(اختياري) لست متأكدًا مما إذا كان هذا مهمًا ولكن كما اقترح شخصًا ما قمت بتحويل .fna - & gt .fa

الجينوم البشري المفهرس مع bwa

محاذاة قراءتي فقط مع الجينوم المفهرس من الخطوة 1

قراءات منفصلة غير معيّنة (كما هو موصى به في المواد والطرق باستخدام -f4)

تم تحويل القراءات غير المعينة إلى تنسيق .fastq (نظرًا لأن هذا هو التنسيق الذي يستخدمه البرنامج لاحقًا)


الخطوة 6: تصدير ملف BAM كجدول

من عارض التسلسل الرسومي ، قم بالتكبير إلى الموقع المطلوب وحدد نطاق الاهتمام.

انقر بزر الماوس الأيمن فوق النطاق المحدد وانقر فوق تصدير البيانات الخيار في قائمة السياق.

سيتم فتح قائمة تصدير المحاذاة. لاحظ أنه يتم تخزين ملفات BAM كمحاذاة ، لذلك تحتاج إلى تحديد "ملف جدول المحاذاة"في القائمة الموجودة على اليسار. حدد الموقع المطلوب في القسم الرئيسي. اسم الملف الهدف. إذا كنت بحاجة إلى تغيير موقع التصدير الافتراضي ، فاستخدم زر المجلد. انقر على التالي زر.

في الشاشة التالية ، حدد الحقول من ملف المحاذاة للتصدير.

انقر على ينهي زر. سيتم تصدير ملفك.

يمكن فتح الملف الذي تم تصديره في برنامج جداول بيانات مثل Excel لمزيد من الاستخدام.


شكر وتقدير

نشكر زملائنا البروفيسور بيل رولينسون والبروفيسور روينا بول ، اللذان أشرفوا على جمع ومعالجة عزلات مرضى SARS-CoV-2 من أجل دراسة منفصلة. شكرًا أيضًا لـ Chandima Samarasinghe و Harshana Weligampola و Nirodha Suchinthana و Rahal Medawatte و Yasiru Ranasinghe لتقديم ملاحظات قيمة بعد الاختبار جينوبو. نعترف بمصادر التمويل التالية: منحة MRFF APP1173594 (إلى I.W.D.) و زمالة التوظيف المبكر لمعهد السرطان في نيو ساوث ويلز 2018 / ECF013 (إلى IWD) والدعم الخيري من مؤسسة Kinghorn (إلى IWD و HG). محتويات المواد المنشورة هي مسؤولية المؤلفين المشاركين أو الأفراد فقط ، وهي لا تعكس آراء أي هيئة تمويل مدرجة.


خلفية

مثيلة الحمض النووي هي تعديل جيني مهم يشارك في إسكات الجينات وتمايز الأنسجة والسرطان [1]. أصبح القياس عالي الدقة على مستوى الجينوم لميثلة الحمض النووي ممكنًا الآن باستخدام تسلسل الجينوم الكامل بيسلفيت (WGBS) ، وهي عملية يتم من خلالها معالجة الحمض النووي المدخل باستخدام بيسلفيت الصوديوم وتسلسله. في حين أن WGBS شامل ، إلا أنه مكلف للغاية [2]. على سبيل المثال ، تطبيق WGBS بواسطة Lister وآخرون. [3] مقارنة ملامح مثيلة الحمض النووي لخط الخلايا الجذعية الجنينية وخط خلية الخلايا الليفية. تم تسلسل كلاهما إلى حوالي 30 × تغطية (تغطية 25 × لجميع CpGs) ، مما يتطلب 376 ممرًا إجماليًا لتسلسل بيسلفيت على أداة Illumina GA II. في حين أن الحكمة التقليدية هي أن هناك حاجة إلى تغطية 30 × أو أعمق لتحقيق نتائج دقيقة ، فإن التقنيات الإحصائية المتقدمة المقترحة هنا ، مثل تجانس الاحتمالية المحلية ، يمكن أن تقلل من هذا المطلب إلى أقل من 4 ×.

وقد ثبت أيضًا أن المناطق الجينومية المختلفة تظهر مستويات مختلفة من اختلاف مثيلة الحمض النووي بين الأفراد [4]. نتيجة لذلك ، يمكن بسهولة الخلط بين المناطق المتغيرة بطبيعتها مع المناطق التي تختلف باستمرار بين المجموعات عندما يتوفر عدد قليل من التكرارات [1] (الشكل 1). لكن إجراء WGBS على عدد التكرارات البيولوجية المطلوبة للتغلب على مثل هذه المشكلات قد يكون مكلفًا للغاية. تعالج التقنيات المقترحة هنا هذه المشكلة من خلال الاستفادة الكاملة من المعلومات المكررة أثناء التحليل ، ومن خلال تقليل التغطية اللازمة للتكرار (وبالتالي تكلفة).

الحاجة إلى التكرارات البيولوجية. نعرض ملامح مثيلة ناعمة لثلاث عينات عادية (زرقاء) وأمراض سرطانية متطابقة (حمراء) من بيانات هانسن [1]. يظهر أيضًا ملف تعريف المثيلة السلس لخط خلوي IMR90 (أسود) من بيانات Lister [3]. لو قمنا بتحليل زوج السرطان العادي 3 فقط (الخطوط السميكة) ، فقد يبدو أن هناك فرق مثيلة بين السرطان والعادي في هذه المنطقة الجينومية. ومع ذلك ، عندما يتم النظر في الأزواج الثلاثة السرطانية العادية ، لا يبدو أن هذه المنطقة هي منطقة ميثلة تفاضلية خاصة بالسرطان.

يبدأ تحليل بيانات WGBS بمحاذاة قراءات بيسلفيت المحولة. بعد المحاذاة ، يتم استخدام الأساليب الإحصائية لتحديد المناطق الميثيلية التفاضلية (DMRs) بين حالتين أو أكثر. تم تكريس عمل مكثف للمحاذاة [5-10] ولكن طرق تحليل ما بعد المحاذاة محدودة. اعتمد العمل المنشور المستند إلى WGBS على نهج معياري يحدد أولاً CpGs الميثيلية التفاضلية التي يتم تجميعها بعد ذلك في مناطق باستخدام مخصصة قواعد التجميع. يتم تنفيذ الخطوة الأولى باستخدام إما اختبار فيشر الدقيق [3 ، 11-13] ، قطع تعسفية للاختلافات في مستويات المثيلة المرصودة [14] ، أو نموذج بيتا ذي الحدين [15]. لا تأخذ أي من هذه الطرق في الاعتبار التباين البيولوجي. على حد علمنا ، لا يوجد برنامج متاح لتنفيذ هذه الأساليب.

نقدم هنا BSmooth ، أداة تحليل شاملة لمجموعات بيانات WGBS. يبدأ خط أنابيب BSmooth بخطوة محاذاة قراءة غير متحيزة ومراعية للبي سلفيت ، ويجمع مقاييس تقييم الجودة بناءً على تقديرات مثيلة الطبقية حسب موضع القراءة ، ويطبق المتوسط ​​المحلي لتحسين دقة قياسات المثيلة الإقليمية ، ويكتشف DMRs المحاسبة للتغير البيولوجي عند توفر التكرارات . تتمثل المساهمة المنهجية الرئيسية لـ BSmooth في القدرة على تحديد حسابات DMRs للتنوع البيولوجي ، بالإضافة إلى تدابير مراقبة الجودة التي نقترحها. بالإضافة إلى ذلك ، يتضمن BSmooth أداة تقويم جديدة ، Merman ، والتي تتعامل بشكل مناسب مع مساحة الألوان. نوضح فوائد BSmooth من خلال أربع مجموعات بيانات متاحة للجمهور: بيانات Lister [3] ، وبيانات Hansen [1] ، وبيانات Hansen-capture [1] وبيانات Tung [16] (انظر المواد والأساليب للحصول على التفاصيل). نستخدم هذه البيانات لإثبات مزايا BSmooth على الخوارزميات الحالية بناءً على اختبار فيشر الدقيق. BSmooth هو أول خط أنابيب لمجموعات بيانات WGBS ينتج DMRs كإخراج ، مع مراعاة التباين البيولوجي أيضًا. يمكنه التعامل مع التصميمات التجريبية منخفضة التغطية ، مما يسمح للباحثين بتحديد عدة عينات بنفس تكلفة ملف تعريف التغطية العالية لعينة واحدة.


ما الأداة التي يجب استخدامها لتعيين القراءات (samtools ، Sequencher ، ...)؟ - مادة الاحياء

Bismark هو برنامج لتعيين تسلسل معالجة بيسلفيت يقرأ إلى الجينوم ذي الأهمية وإجراء مكالمات المثيلة في خطوة واحدة. يمكن استيراد المخرجات بسهولة إلى عارض الجينوم ، مثل SeqMonk ، وتمكن الباحث من تحليل مستويات المثيلة لعيناته على الفور. ميزاته الرئيسية هي:

  • رسم خرائط بيسلفيت واستدعاء المثيلة في خطوة واحدة
  • يدعم محاذاة القراءة أحادية النهاية ونهاية مقترنة
  • يدعم المحاذاة غير المحددة والفجوة
  • طول بذرة المحاذاة وعدد حالات عدم التطابق وما إلى ذلك قابلة للتعديل
  • يميز الإخراج بين مثيلة السيتوزين في سياق CpG و CHG و CHH

يتوفر Bismark الآن أيضًا من GitHub. أنت مدعو لترك التعليقات أو طلب الميزة أو تقارير الأخطاء هناك!

سينقلك هذا الرابط إلى منشور Bismark.

سينقلك هذا الرابط إلى مراجعتنا حول تحليل البيانات الأولية في BS-Seq.

سينقلك هذا الرابط إلى بروتوكولنا "مراقبة الجودة والتشذيب والمواءمة لبيانات Bisulfite-Seq" على موقع Epigenesys الإلكتروني.

هنا يمكنك الوصول إلى وثائق Bismark دليل مستخدم Bismark.

فيما يلي نظرة عامة على أوضاع المحاذاة التي يدعمها حاليًا Bismark: أوضاع محاذاة Bismark (pdf).


شاهد الفيديو: Sequencher Tour Guide Part 1 (كانون الثاني 2022).