.SAM - นามสกุลไฟล์

.sam คือไฟล์การจัดตำแหน่ง/แผนที่หรือไฟล์ตัวอย่างแก้ไข mod ....

คุณสมบัติ คำอธิบาย
รูปแบบ เกี่ยวกับข้อความ
วัตถุประสงค์ จัดเก็บลำดับทางชีวภาพที่สอดคล้องกับลำดับอ้างอิง
แอปพลิเคชัน แอสเซมบลีจีโนม, การโทรที่หลากหลาย, การวิเคราะห์การแสดงออกของยีน
องค์ประกอบสำคัญ ส่วนส่วนหัวส่วนการจัดตำแหน่ง
ส่วนส่วนหัว มีข้อมูลเมตาเกี่ยวกับลำดับการอ้างอิงและการอ่านที่จัดแนว
การจัดตำแหน่ง ประกอบด้วยบันทึกการจัดตำแหน่งแต่ละรายการสำหรับการอ่านแต่ละครั้ง
ข้อดี มนุษย์สามารถอ่านได้ง่ายเข้าถึงได้ง่าย
ข้อ จำกัด ขนาดไฟล์อาจมีขนาดใหญ่
รูปแบบทางเลือก ไฟล์ BAM (การจัดตำแหน่งไบนารี/แผนที่) - การประมวลผลที่เล็กลงเร็วขึ้นเร็วขึ้น

ไฟล์ SAM คืออะไร?

ไฟล์ SAM หรือไฟล์ การจัดตำแหน่ง/แผนที่ลำดับ เป็นรูปแบบข้อความสำหรับการจัดเก็บลำดับทางชีวภาพที่จัดเรียงกับลำดับการอ้างอิง มันมักจะใช้ในแอปพลิเคชันชีวสารสนเทศเช่นการประกอบจีโนมการโทรที่หลากหลายและการวิเคราะห์การแสดงออกของยีน

ไฟล์ SAM ประกอบด้วยสองส่วนหลัก:

  1. ส่วนส่วนหัว: ส่วนนี้มีข้อมูลเกี่ยวกับลำดับการอ้างอิงและลำดับที่จัดเรียงเช่นสปีชีส์โครโมโซมและความยาวลำดับ

  2. ส่วนการจัดตำแหน่ง: ส่วนนี้มีการจัดตำแหน่งของลำดับกับลำดับอ้างอิง แต่ละบรรทัดในส่วนการจัดตำแหน่งสอดคล้องกับการอ่านแบบจัดตำแหน่งเดียว

ข้อมูลการจัดตำแหน่งในไฟล์ SAM จะถูกแสดงโดยใช้ชุดของฟิลด์ซึ่งแต่ละรายการมีความหมายเฉพาะ สาขาที่สำคัญที่สุดบางแห่ง ได้แก่ :

  • qname: ตัวระบุที่ไม่ซ้ำกันสำหรับการอ่าน
  • RNAME: ชื่อของลำดับการอ้างอิงที่การอ่านถูกจัดแนว
  • POS: ตำแหน่งของฐานแรกในการอ่านที่สอดคล้องกับลำดับการอ้างอิง
  • MAPQ: คุณภาพการทำแผนที่ซึ่งเป็นการวัดความมั่นใจในการจัดตำแหน่ง
  • ซิการ์: สตริงซิการ์ซึ่งเข้ารหัสการดำเนินการจัดตำแหน่ง (เช่นการจับคู่, การแทรก, การลบ)
  • SEQ: ลำดับการอ่าน
  • คุณสมบัติ: คะแนนคุณภาพ Phred สำหรับแต่ละฐานในการอ่าน

ไฟล์ SAM นั้นสามารถอ่านได้ แต่ยังสามารถบีบอัดเป็นรูปแบบไบนารีที่เรียกว่า BAM (การจัดตำแหน่งไบนารี/แผนที่) สำหรับการจัดเก็บและการประมวลผลที่มีประสิทธิภาพมากขึ้น

นี่คือตัวอย่างของบันทึกไฟล์ SAM :

 QNAMERNAMEPOSMAPQCIGARRNEXTPNEXTTLENSEQQUAL read1chr110060100M*0100TGGATACCCCAATTTACTGACTTACTTGACTT<<<<<<<<<

บันทึกนี้บ่งชี้ว่าการอ่านชื่อ "Read1" นั้นจัดเรียงกับโครโมโซม 1 ที่ตำแหน่ง 100 ด้วยคุณภาพการทำแผนที่ 60 สตริงซิการ์ "100m" บ่งชี้ว่าการอ่านทั้งหมดตรงกับลำดับการอ้างอิง ฟิลด์ RNEXT และ PNEXT ถูกตั้งค่าเป็น "*" และ 0 ตามลำดับแสดงว่าการอ่านไม่ได้เป็นส่วนหนึ่งของการอ่านแบบจับคู่ ฟิลด์ TLEN คือ 100 แสดงว่าการอ่านมีความยาว 100 ฐาน ฟิลด์ SEQ มีลำดับการอ่านและฟิลด์ Qual มีคะแนนคุณภาพ Phred สำหรับแต่ละฐานในการอ่าน

ไฟล์ SAM เป็นเครื่องมือที่มีค่าสำหรับนักวิจัยด้านชีวสารสนเทศศาสตร์เนื่องจากมีรูปแบบมาตรฐานสำหรับการจัดเก็บและแลกเปลี่ยนข้อมูลการจัดตำแหน่ง พวกเขามีการใช้กันอย่างแพร่หลายในแอปพลิเคชันที่หลากหลายและมีแนวโน้มที่จะยังคงเป็นเครื่องมือสำคัญต่อไปอีกหลายปี

ประเภทไฟล์ต่าง ๆ ที่สามารถใช้ Sam Extension?

. แซม ยังสามารถเป็น ไฟล์ตัวอย่างแก้ไข mod เป็นรูปแบบไฟล์ที่ใช้โดยซอฟต์แวร์แก้ไขเสียง Mod Edit Mod Edit เป็นโปรแกรมสำหรับการสร้างและแก้ไขโมดูลเพลงซึ่งเป็นไฟล์ขนาดเล็กที่มีข้อมูลเพลงในรูปแบบบีบอัด mod แก้ไขไฟล์ SAM PLE มีข้อมูลเสียงดิบสำหรับ SAM PLES ที่ใช้ในโมดูล

นี่คือตารางที่สรุปประเภทไฟล์ต่าง ๆ ที่สามารถใช้ Sam Extension:

ประเภทไฟล์ คำอธิบาย
เอกสาร Ami Pro เอกสารการประมวลผลคำที่สร้างโดย samna ami pro
ไฟล์ตัวอย่าง lmhosts ไฟล์ตัวอย่างสำหรับไฟล์ lmhosts ซึ่งแมปที่อยู่ IP เป็นชื่อโฮสต์
mod แก้ไขไฟล์ตัวอย่าง ไฟล์ตัวอย่างสำหรับซอฟต์แวร์แก้ไขเสียง Mod Edit
ไฟล์การจัดเรียงลำดับ/แผนที่ (SAM) รูปแบบข้อความสำหรับการจัดเก็บลำดับทางชีวภาพที่สอดคล้องกับลำดับการอ้างอิง

ประเภทไฟล์เฉพาะของ ไฟล์ SAM สามารถกำหนดได้โดยบริบทที่พบ ตัวอย่างเช่นหากไฟล์อยู่ในโฟลเดอร์ที่มีไฟล์เสียงอื่น ๆ น่าจะเป็นไฟล์ Mod Edit Sam Ple หากไฟล์อยู่ในโฟลเดอร์ที่มีไฟล์ข้อมูลชีวภาพอื่น ๆ อาจเป็นไฟล์ SAM

จะเปิดไฟล์ SAM ได้อย่างไร?

ไฟล์ SAM สามารถเปิดได้โดยใช้ตัวแก้ไขข้อความและแพ็คเกจซอฟต์แวร์ชีวสารสนเทศศาสตร์ที่หลากหลาย ตัวเลือกยอดนิยมบางอย่าง ได้แก่ :

  • Notepad ++: ตัวแก้ไขข้อความฟรีและโอเพนซอร์ซที่สามารถจัดการไฟล์ SAM ขนาดใหญ่ได้

  • Samtools: เครื่องมือแบบสแตนด์อโลนสำหรับการประมวลผลไฟล์ SAM และ BAM

  • Geneious: แพคเกจซอฟต์แวร์ชีวสารสนเทศเชิงพาณิชย์ที่มีส่วนต่อประสานกราฟิกผู้ใช้สำหรับการดูและวิเคราะห์ไฟล์ SAM

จะแปลงไฟล์ SAM ได้อย่างไร?

ไฟล์ SAM สามารถแปลงเป็นรูปแบบอื่น ๆ ที่หลากหลายรวมถึง BAM , SAMGZ และ เตียง ตัวเลือกยอดนิยมบางอย่างสำหรับการแปลงไฟล์ SAM ได้แก่ :

  • Samtools: สามารถแปลงไฟล์ SAM เป็น BAM, SAM GZ และรูปแบบเตียงได้

  • Bedtools: สามารถแปลงไฟล์ SAM เป็นรูปแบบเตียงได้

  • Picard: ชุดเครื่องมือชีวสารสนเทศศาสตร์ที่ใช้ Java ซึ่งมีเครื่องมือสำหรับการแปลงไฟล์ SAM เป็นรูปแบบต่างๆ

ความแตกต่างระหว่างไฟล์ SAM และ BAM?

ไฟล์ SAM และ BAM เป็นทั้งรูปแบบสำหรับการจัดเก็บลำดับทางชีวภาพที่สอดคล้องกับลำดับอ้างอิง ความแตกต่างหลักระหว่างสองรูปแบบคือไฟล์ SAM เป็นไฟล์ข้อความที่มนุษย์อ่านได้ในขณะที่ไฟล์ BAM เป็นไฟล์ไบนารี สิ่งนี้ทำให้ไฟล์ BAM มีขนาดเล็กลงและเร็วขึ้นในการอ่านและประมวลผล อย่างไรก็ตามไฟล์ BAM ไม่สามารถแก้ไขได้โดยตรงในตัวแก้ไขข้อความดังนั้นไฟล์ SAM ยังคงมีประโยชน์สำหรับการตรวจสอบและแก้ไขของมนุษย์

จะสร้างไฟล์ SAM ได้อย่างไร?

ไฟล์ SAM สามารถสร้างขึ้นได้โดยใช้แพ็คเกจซอฟต์แวร์ชีวสารสนเทศที่หลากหลาย ตัวเลือกยอดนิยมบางอย่าง ได้แก่ :

  • BWA: เครื่องมือในการจัดตำแหน่งการอ่านระยะสั้นให้เป็นลำดับการอ้างอิง

  • Bowtie2: เครื่องมือยอดนิยมอีกอย่างหนึ่งสำหรับการจัดตำแหน่งการอ่านสั้น ๆ ให้เป็นลำดับอ้างอิง

  • NOVOALIGN : ผู้จัดตำแหน่งเชิงพาณิชย์ที่มีชื่อเสียงด้านความเร็วและความแม่นยำ

จะอ่านไฟล์ SAM ได้อย่างไร?

ไฟล์ SAM สามารถอ่านได้โดยใช้ตัวแก้ไขข้อความและแพ็คเกจซอฟต์แวร์ชีวสารสนเทศที่หลากหลาย ตัวเลือกยอดนิยมบางอย่าง ได้แก่ :

  • Notepad ++: สามารถแสดงไฟล์ SAM ในรูปแบบที่มนุษย์อ่านได้

  • SAM Tools: สามารถอ่านไฟล์ SAM และแยกข้อมูลเฉพาะเช่นการอ่านที่จัดตำแหน่งหรือคะแนนคุณภาพการแมป

  • Geneious: สามารถให้มุมมองกราฟิกของข้อมูลการจัดตำแหน่งในไฟล์ SAM

บางส่วนของไฟล์ SAM ?

ไฟล์ SAM ประกอบด้วยสองส่วนหลัก:

  1. ส่วนส่วนหัว: มีข้อมูลเมตาเกี่ยวกับลำดับการอ้างอิงและการอ่านที่จัดเรียงเช่นสปีชีส์โครโมโซมและความยาวลำดับ

  2. ส่วนการจัดตำแหน่ง: มีการจัดตำแหน่งของการอ่านไปยังลำดับการอ้างอิง แต่ละบรรทัดในส่วนการจัดตำแหน่งสอดคล้องกับการอ่านแบบจัดตำแหน่งเดียว

ปัญหาทั่วไปเกี่ยวกับไฟล์ SAM ?

ปัญหาทั่วไปบางอย่างที่อาจเกิดขึ้นกับไฟล์ SAM ได้แก่ :

  • อ่านซ้ำ: อ่านที่สอดคล้องกับลำดับการอ้างอิงหลายครั้ง

  • อ่านไม่ได้: อ่านที่ไม่สามารถจัดแนวกับลำดับการอ้างอิงได้

  • การจัดตำแหน่งที่ไม่ถูกต้อง: การจัดตำแหน่งที่ไม่ถูกต้องหรือไม่สะท้อนความสัมพันธ์ทางชีวภาพที่แท้จริงระหว่างการอ่านและลำดับการอ้างอิง

ปัญหาเหล่านี้อาจเกิดขึ้นได้เนื่องจากปัจจัยต่าง ๆ เช่นข้อผิดพลาดในการเรียงลำดับความครอบคลุมต่ำหรือโครงสร้างจีโนมที่ซับซ้อน การแก้ไขปัญหาเหล่านี้มักจะต้องใช้เทคนิคและเครื่องมือทางชีวสารสนเทศศาสตร์เฉพาะ

The 1000 Genomes Project

Biological Sequence

Text-based file

นามสกุลไฟล์ใหม่ อัพเดทล่าสุด ไฟล์ภาพ 3 มิติ ไฟล์เสียง สำรองไฟล์ ไฟล์ CAD ไฟล์ Raw ของกล้อง ไฟล์บีบอัด ไฟล์ข้อมูล ไฟล์ฐานข้อมูล ไฟล์สำหรับนักพัฒนา ไฟล์ภาพดิสก์ ไฟล์ที่เข้ารหัส ไฟล์ปฏิบัติการ ไฟล์ฟอนต์ ไฟล์ GIS ไฟล์เกม ไฟล์อื่นๆ ไฟล์เค้าโครงหน้า ไฟล์ปลั๊กอิน ไฟล์ภาพแรสเตอร์ ไฟล์การตั้งค่า ไฟล์สเปรดชีต ไฟล์ระบบ ไฟล์ข้อความ ไฟล์ภาพเวกเตอร์ ไฟล์วิดีโอ ไฟล์เว็บ ไฟล์ eBook