Apa itu file sam ?
File SAM , atau file penyelarasan/peta urutan , adalah format berbasis teks untuk menyimpan urutan biologis yang disejajarkan dengan urutan referensi. Ini umumnya digunakan dalam aplikasi bioinformatika seperti perakitan genom, varian panggilan, dan analisis ekspresi gen.
File SAM terdiri dari dua bagian utama:
Bagian Header: Bagian ini berisi informasi tentang urutan referensi dan urutan yang selaras, seperti spesies, kromosom, dan panjang urutan.
Bagian Alignment: Bagian ini berisi penyelarasan urutan ke urutan referensi. Setiap baris di bagian Alignment sesuai dengan satu bacaan yang selaras.
Informasi penyelarasan dalam file SAM diwakili menggunakan serangkaian bidang, yang masing -masing memiliki makna tertentu. Beberapa bidang terpenting meliputi:
- QName: Pengidentifikasi unik untuk dibaca
- RNAME: Nama urutan referensi yang dibaca diselaraskan
- POS: Posisi basis pertama dalam bacaan yang selaras dengan urutan referensi
- MAPQ: Kualitas pemetaan, yang merupakan ukuran kepercayaan pada penyelarasan
- Cigar: String cerutu, yang mengkodekan operasi penyelarasan (misalnya, cocok, penyisipan, penghapusan)
- SEQ: Urutan Baca
- Qual: Skor kualitas phred untuk setiap basis di bacaan
File SAM dapat dibaca manusia, tetapi mereka juga dapat dikompresi menjadi format biner yang disebut BAM (Biner Alignment/MAP) untuk penyimpanan dan pemrosesan yang lebih efisien.
Berikut adalah contoh catatan file SAM :
QNAMERNAMEPOSMAPQCIGARRNEXTPNEXTTLENSEQQUAL read1chr110060100M*0100TGGATACCCCAATTTACTGACTTACTTGACTT<<<<<<<<<
Catatan ini menunjukkan bahwa bacaan bernama "read1" disejajarkan dengan kromosom 1 pada posisi 100 dengan kualitas pemetaan 60. String cerutu "100m" menunjukkan bahwa seluruh bacaan cocok dengan urutan referensi. Bidang rnext dan pnext diatur ke "*" dan 0, masing-masing, menunjukkan bahwa bacaan bukan bagian dari bacaan berpasangan. Bidang TLEN adalah 100, menunjukkan bahwa bacaan panjangnya 100 pangkalan. Bidang SEQ berisi urutan baca, dan bidang Qual berisi skor kualitas phred untuk setiap basis dalam bacaan.
File SAM adalah alat yang berharga bagi para peneliti bioinformatika, karena mereka memberikan format standar untuk menyimpan dan bertukar data penyelarasan. Mereka banyak digunakan dalam berbagai aplikasi, dan mereka cenderung terus menjadi alat penting untuk bertahun -tahun yang akan datang.
Berbagai jenis file yang dapat menggunakan. Ekstensi Sam ?
. SAM juga bisa menjadi file sampel Edit MOD . Ini adalah format file yang digunakan oleh perangkat lunak pengeditan audio MOD Edit. MOD Edit adalah program untuk membuat dan mengedit modul musik, yang merupakan file kecil yang berisi data musik dalam format terkompresi. MOD Edit File Sam Ple berisi data audio mentah untuk sam ples yang digunakan dalam modul.
Berikut adalah tabel yang merangkum berbagai jenis file yang dapat menggunakan. Ekstensi Sam :
Jenis file | Keterangan |
---|
AMI Pro Document | Dokumen pengolah kata yang dibuat oleh Samna Ami Pro |
File sampel lmhosts | File sampel untuk file LMHosts, yang memetakan alamat IP ke nama host |
Mod Edit File Sampel | File Sampel untuk MOD Edit Software Pengeditan Audio |
File Alignment/Map (SAM) urutan | Format berbasis teks untuk menyimpan urutan biologis yang selaras dengan urutan referensi |
Jenis file spesifik dari a. File SAM biasanya dapat ditentukan oleh konteks di mana ia ditemukan. Misalnya, jika file tersebut terletak di folder yang berisi file audio lainnya, kemungkinan file SAM edit mod. Jika file terletak di folder yang berisi file data biologis lainnya, kemungkinan file SAM .
Bagaimana cara membuka file SAM ?
File SAM dapat dibuka menggunakan berbagai paket editor teks dan perangkat lunak bioinformatika. Beberapa opsi populer meliputi:
Notepad ++: Editor teks gratis dan open-source yang dapat menangani file SAM besar.
Samtools: Alat mandiri untuk memproses file SAM dan BAM.
GenEious: Paket perangkat lunak bioinformatika komersial dengan antarmuka pengguna grafis untuk melihat dan menganalisis file SAM .
Bagaimana cara mengonversi file SAM ?
File SAM dapat dikonversi ke berbagai format lain, termasuk BAM , SAMGZ , dan BED . Beberapa opsi populer untuk mengonversi file SAM meliputi:
Samtools: Dapat mengonversi file SAM ke format BAM, SAM GZ, dan BED.
Bedtools: Dapat mengonversi file SAM ke format tempat tidur.
Picard: Toolkit bioinformatika berbasis Java yang mencakup alat untuk mengonversi file SAM ke berbagai format.
Perbedaan antara file SAM dan BAM?
File SAM dan BAM keduanya format untuk menyimpan urutan biologis yang disejajarkan dengan urutan referensi. Perbedaan utama antara kedua format adalah bahwa file SAM adalah file teks yang dapat dibaca manusia, sedangkan file BAM adalah file biner. Ini membuat file BAM secara signifikan lebih kecil dan lebih cepat untuk dibaca dan diproses. Namun, file BAM tidak dapat diedit secara langsung dalam editor teks, jadi file SAM masih berguna untuk inspeksi dan pengeditan manusia.
Bagaimana cara membuat file sam ?
File SAM dapat dibuat menggunakan berbagai paket perangkat lunak bioinformatika. Beberapa opsi populer meliputi:
BWA: Alat untuk menyelaraskan pembacaan pendek ke urutan referensi.
Bowtie2: Alat populer lain untuk menyelaraskan pembacaan pendek ke urutan referensi.
Novoalign : Aligner komersial dengan reputasi untuk kecepatan dan akurasinya.
Bagaimana cara membaca file sam ?
File SAM dapat dibaca menggunakan berbagai paket editor teks dan perangkat lunak bioinformatika. Beberapa opsi populer meliputi:
Notepad ++: Dapat menampilkan file SAM dalam format yang dapat dibaca manusia.
Sam Tools: Dapat membaca file SAM dan mengekstrak informasi spesifik, seperti bacaan yang disejajarkan atau skor kualitas pemetaan.
Geneious: Dapat memberikan tampilan grafis dari informasi penyelarasan dalam file SAM .
Bagian dari file sam ?
File SAM terdiri dari dua bagian utama:
Bagian Header: Berisi metadata tentang urutan referensi dan bacaan yang selaras, seperti spesies, kromosom, dan panjang urutan.
Bagian Alignment: Berisi perataan bacaan dengan urutan referensi. Setiap baris di bagian Alignment sesuai dengan satu bacaan yang selaras.
Masalah umum dengan file SAM ?
Beberapa masalah umum yang dapat terjadi dengan file SAM meliputi:
Duplikat Baca: Membaca yang sejajar dengan urutan referensi beberapa kali.
Baca yang belum dipetakan: Bacaan yang tidak dapat disejajarkan dengan urutan referensi.
Penyelarasan yang salah: Penyelarasan yang tidak akurat atau yang tidak mencerminkan hubungan biologis yang sebenarnya antara bacaan dan urutan referensi.
Masalah -masalah ini dapat muncul karena berbagai faktor, seperti kesalahan pengurutan, cakupan rendah, atau struktur genomik yang kompleks. Mengatasi masalah ini seringkali membutuhkan teknik dan alat bioinformatika khusus