ไฟล์ SAM คืออะไร?
ไฟล์ SAM หรือไฟล์ การจัดตำแหน่ง/แผนที่ลำดับ เป็นรูปแบบข้อความสำหรับการจัดเก็บลำดับทางชีวภาพที่จัดเรียงกับลำดับการอ้างอิง มันมักจะใช้ในแอปพลิเคชันชีวสารสนเทศเช่นการประกอบจีโนมการโทรที่หลากหลายและการวิเคราะห์การแสดงออกของยีน
ไฟล์ SAM ประกอบด้วยสองส่วนหลัก:
ส่วนส่วนหัว: ส่วนนี้มีข้อมูลเกี่ยวกับลำดับการอ้างอิงและลำดับที่จัดเรียงเช่นสปีชีส์โครโมโซมและความยาวลำดับ
ส่วนการจัดตำแหน่ง: ส่วนนี้มีการจัดตำแหน่งของลำดับกับลำดับอ้างอิง แต่ละบรรทัดในส่วนการจัดตำแหน่งสอดคล้องกับการอ่านแบบจัดตำแหน่งเดียว
ข้อมูลการจัดตำแหน่งในไฟล์ SAM จะถูกแสดงโดยใช้ชุดของฟิลด์ซึ่งแต่ละรายการมีความหมายเฉพาะ สาขาที่สำคัญที่สุดบางแห่ง ได้แก่ :
- qname: ตัวระบุที่ไม่ซ้ำกันสำหรับการอ่าน
- RNAME: ชื่อของลำดับการอ้างอิงที่การอ่านถูกจัดแนว
- POS: ตำแหน่งของฐานแรกในการอ่านที่สอดคล้องกับลำดับการอ้างอิง
- MAPQ: คุณภาพการทำแผนที่ซึ่งเป็นการวัดความมั่นใจในการจัดตำแหน่ง
- ซิการ์: สตริงซิการ์ซึ่งเข้ารหัสการดำเนินการจัดตำแหน่ง (เช่นการจับคู่, การแทรก, การลบ)
- SEQ: ลำดับการอ่าน
- คุณสมบัติ: คะแนนคุณภาพ Phred สำหรับแต่ละฐานในการอ่าน
ไฟล์ SAM นั้นสามารถอ่านได้ แต่ยังสามารถบีบอัดเป็นรูปแบบไบนารีที่เรียกว่า BAM (การจัดตำแหน่งไบนารี/แผนที่) สำหรับการจัดเก็บและการประมวลผลที่มีประสิทธิภาพมากขึ้น
นี่คือตัวอย่างของบันทึกไฟล์ SAM :
QNAMERNAMEPOSMAPQCIGARRNEXTPNEXTTLENSEQQUAL read1chr110060100M*0100TGGATACCCCAATTTACTGACTTACTTGACTT<<<<<<<<<
บันทึกนี้บ่งชี้ว่าการอ่านชื่อ "Read1" นั้นจัดเรียงกับโครโมโซม 1 ที่ตำแหน่ง 100 ด้วยคุณภาพการทำแผนที่ 60 สตริงซิการ์ "100m" บ่งชี้ว่าการอ่านทั้งหมดตรงกับลำดับการอ้างอิง ฟิลด์ RNEXT และ PNEXT ถูกตั้งค่าเป็น "*" และ 0 ตามลำดับแสดงว่าการอ่านไม่ได้เป็นส่วนหนึ่งของการอ่านแบบจับคู่ ฟิลด์ TLEN คือ 100 แสดงว่าการอ่านมีความยาว 100 ฐาน ฟิลด์ SEQ มีลำดับการอ่านและฟิลด์ Qual มีคะแนนคุณภาพ Phred สำหรับแต่ละฐานในการอ่าน
ไฟล์ SAM เป็นเครื่องมือที่มีค่าสำหรับนักวิจัยด้านชีวสารสนเทศศาสตร์เนื่องจากมีรูปแบบมาตรฐานสำหรับการจัดเก็บและแลกเปลี่ยนข้อมูลการจัดตำแหน่ง พวกเขามีการใช้กันอย่างแพร่หลายในแอปพลิเคชันที่หลากหลายและมีแนวโน้มที่จะยังคงเป็นเครื่องมือสำคัญต่อไปอีกหลายปี
ประเภทไฟล์ต่าง ๆ ที่สามารถใช้ Sam Extension?
. แซม ยังสามารถเป็น ไฟล์ตัวอย่างแก้ไข mod เป็นรูปแบบไฟล์ที่ใช้โดยซอฟต์แวร์แก้ไขเสียง Mod Edit Mod Edit เป็นโปรแกรมสำหรับการสร้างและแก้ไขโมดูลเพลงซึ่งเป็นไฟล์ขนาดเล็กที่มีข้อมูลเพลงในรูปแบบบีบอัด mod แก้ไขไฟล์ SAM PLE มีข้อมูลเสียงดิบสำหรับ SAM PLES ที่ใช้ในโมดูล
นี่คือตารางที่สรุปประเภทไฟล์ต่าง ๆ ที่สามารถใช้ Sam Extension:
ประเภทไฟล์ | คำอธิบาย |
---|
เอกสาร Ami Pro | เอกสารการประมวลผลคำที่สร้างโดย samna ami pro |
ไฟล์ตัวอย่าง lmhosts | ไฟล์ตัวอย่างสำหรับไฟล์ lmhosts ซึ่งแมปที่อยู่ IP เป็นชื่อโฮสต์ |
mod แก้ไขไฟล์ตัวอย่าง | ไฟล์ตัวอย่างสำหรับซอฟต์แวร์แก้ไขเสียง Mod Edit |
ไฟล์การจัดเรียงลำดับ/แผนที่ (SAM) | รูปแบบข้อความสำหรับการจัดเก็บลำดับทางชีวภาพที่สอดคล้องกับลำดับการอ้างอิง |
ประเภทไฟล์เฉพาะของ ไฟล์ SAM สามารถกำหนดได้โดยบริบทที่พบ ตัวอย่างเช่นหากไฟล์อยู่ในโฟลเดอร์ที่มีไฟล์เสียงอื่น ๆ น่าจะเป็นไฟล์ Mod Edit Sam Ple หากไฟล์อยู่ในโฟลเดอร์ที่มีไฟล์ข้อมูลชีวภาพอื่น ๆ อาจเป็นไฟล์ SAM
จะเปิดไฟล์ SAM ได้อย่างไร?
ไฟล์ SAM สามารถเปิดได้โดยใช้ตัวแก้ไขข้อความและแพ็คเกจซอฟต์แวร์ชีวสารสนเทศศาสตร์ที่หลากหลาย ตัวเลือกยอดนิยมบางอย่าง ได้แก่ :
Notepad ++: ตัวแก้ไขข้อความฟรีและโอเพนซอร์ซที่สามารถจัดการไฟล์ SAM ขนาดใหญ่ได้
Samtools: เครื่องมือแบบสแตนด์อโลนสำหรับการประมวลผลไฟล์ SAM และ BAM
Geneious: แพคเกจซอฟต์แวร์ชีวสารสนเทศเชิงพาณิชย์ที่มีส่วนต่อประสานกราฟิกผู้ใช้สำหรับการดูและวิเคราะห์ไฟล์ SAM
จะแปลงไฟล์ SAM ได้อย่างไร?
ไฟล์ SAM สามารถแปลงเป็นรูปแบบอื่น ๆ ที่หลากหลายรวมถึง BAM , SAMGZ และ เตียง ตัวเลือกยอดนิยมบางอย่างสำหรับการแปลงไฟล์ SAM ได้แก่ :
Samtools: สามารถแปลงไฟล์ SAM เป็น BAM, SAM GZ และรูปแบบเตียงได้
Bedtools: สามารถแปลงไฟล์ SAM เป็นรูปแบบเตียงได้
Picard: ชุดเครื่องมือชีวสารสนเทศศาสตร์ที่ใช้ Java ซึ่งมีเครื่องมือสำหรับการแปลงไฟล์ SAM เป็นรูปแบบต่างๆ
ความแตกต่างระหว่างไฟล์ SAM และ BAM?
ไฟล์ SAM และ BAM เป็นทั้งรูปแบบสำหรับการจัดเก็บลำดับทางชีวภาพที่สอดคล้องกับลำดับอ้างอิง ความแตกต่างหลักระหว่างสองรูปแบบคือไฟล์ SAM เป็นไฟล์ข้อความที่มนุษย์อ่านได้ในขณะที่ไฟล์ BAM เป็นไฟล์ไบนารี สิ่งนี้ทำให้ไฟล์ BAM มีขนาดเล็กลงและเร็วขึ้นในการอ่านและประมวลผล อย่างไรก็ตามไฟล์ BAM ไม่สามารถแก้ไขได้โดยตรงในตัวแก้ไขข้อความดังนั้นไฟล์ SAM ยังคงมีประโยชน์สำหรับการตรวจสอบและแก้ไขของมนุษย์
จะสร้างไฟล์ SAM ได้อย่างไร?
ไฟล์ SAM สามารถสร้างขึ้นได้โดยใช้แพ็คเกจซอฟต์แวร์ชีวสารสนเทศที่หลากหลาย ตัวเลือกยอดนิยมบางอย่าง ได้แก่ :
BWA: เครื่องมือในการจัดตำแหน่งการอ่านระยะสั้นให้เป็นลำดับการอ้างอิง
Bowtie2: เครื่องมือยอดนิยมอีกอย่างหนึ่งสำหรับการจัดตำแหน่งการอ่านสั้น ๆ ให้เป็นลำดับอ้างอิง
NOVOALIGN : ผู้จัดตำแหน่งเชิงพาณิชย์ที่มีชื่อเสียงด้านความเร็วและความแม่นยำ
จะอ่านไฟล์ SAM ได้อย่างไร?
ไฟล์ SAM สามารถอ่านได้โดยใช้ตัวแก้ไขข้อความและแพ็คเกจซอฟต์แวร์ชีวสารสนเทศที่หลากหลาย ตัวเลือกยอดนิยมบางอย่าง ได้แก่ :
Notepad ++: สามารถแสดงไฟล์ SAM ในรูปแบบที่มนุษย์อ่านได้
SAM Tools: สามารถอ่านไฟล์ SAM และแยกข้อมูลเฉพาะเช่นการอ่านที่จัดตำแหน่งหรือคะแนนคุณภาพการแมป
Geneious: สามารถให้มุมมองกราฟิกของข้อมูลการจัดตำแหน่งในไฟล์ SAM
บางส่วนของไฟล์ SAM ?
ไฟล์ SAM ประกอบด้วยสองส่วนหลัก:
ส่วนส่วนหัว: มีข้อมูลเมตาเกี่ยวกับลำดับการอ้างอิงและการอ่านที่จัดเรียงเช่นสปีชีส์โครโมโซมและความยาวลำดับ
ส่วนการจัดตำแหน่ง: มีการจัดตำแหน่งของการอ่านไปยังลำดับการอ้างอิง แต่ละบรรทัดในส่วนการจัดตำแหน่งสอดคล้องกับการอ่านแบบจัดตำแหน่งเดียว
ปัญหาทั่วไปเกี่ยวกับไฟล์ SAM ?
ปัญหาทั่วไปบางอย่างที่อาจเกิดขึ้นกับไฟล์ SAM ได้แก่ :
อ่านซ้ำ: อ่านที่สอดคล้องกับลำดับการอ้างอิงหลายครั้ง
อ่านไม่ได้: อ่านที่ไม่สามารถจัดแนวกับลำดับการอ้างอิงได้
การจัดตำแหน่งที่ไม่ถูกต้อง: การจัดตำแหน่งที่ไม่ถูกต้องหรือไม่สะท้อนความสัมพันธ์ทางชีวภาพที่แท้จริงระหว่างการอ่านและลำดับการอ้างอิง
ปัญหาเหล่านี้อาจเกิดขึ้นได้เนื่องจากปัจจัยต่าง ๆ เช่นข้อผิดพลาดในการเรียงลำดับความครอบคลุมต่ำหรือโครงสร้างจีโนมที่ซับซ้อน การแก้ไขปัญหาเหล่านี้มักจะต้องใช้เทคนิคและเครื่องมือทางชีวสารสนเทศศาสตร์เฉพาะ