Що таке файл SAM ?
Файл SAM , або файл вирівнювання послідовностей/карта ,-це текстовий формат для зберігання біологічних послідовностей, вирівняних до референтної послідовності. Він зазвичай використовується в програмах біоінформатики, таких як складання геному, варіант виклику та аналіз експресії генів.
Файл SAM складається з двох основних розділів:
Розділ заголовка: Цей розділ містить інформацію про еталонну послідовність та вирівняні послідовності, такі як види, хромосома та довжина послідовності.
Розділ вирівнювання: Цей розділ містить вирівнювання послідовностей до опорної послідовності. Кожен рядок у розділі вирівнювання відповідає одному вирівняному прочитаному.
Інформація про вирівнювання у файлі SAM представлена за допомогою ряду полів, кожен з яких має конкретне значення. Деякі з найважливіших полів включають:
- QNAME: Унікальний ідентифікатор для читання
- Rname: Назва еталонної послідовності, до якої вирівнюється читання
- POS: Положення першої бази в прочитаному, яке узгоджується з еталонною послідовністю
- MAPQ: Якість відображення, що є мірою впевненості у вирівнюванні
- Сигара: струна сигар, яка кодує операції з вирівнюванням (наприклад, відповідність, вставка, видалення)
- SEQ: Послідовність читання
- Якість: показник якості PHRED для кожної бази в читанні
Файли SAM є людиною, що читаються на людину, але вони також можуть бути стиснуті у двійковий формат під назвою BAM (двійкове вирівнювання/карта) для більш ефективного зберігання та обробки.
Ось приклад запису файлу SAM :
QNAMERNAMEPOSMAPQCIGARRNEXTPNEXTTLENSEQQUAL read1chr110060100M*0100TGGATACCCCAATTTACTGACTTACTTGACTT<<<<<<<<<
Цей запис вказує на те, що читання під назвою "Read1" вирівнюється до хромосоми 1 у положенні 100 з якістю відображення 60. Сигарна струна "100 м" вказує на те, що все читання відповідає еталонній послідовності. Поля RNEXT та PNEXT встановлюються відповідно "*" та 0, що вказує на те, що читання не є частиною прочитання парного кінця. Поле TLEN становить 100, що вказує на те, що читання триває 100 баз. Поле SEQ містить послідовність зчитування, а поле якості містить показники якості PHRED для кожної бази в читанні.
Файли SAM є цінним інструментом для дослідників біоінформатики, оскільки вони забезпечують стандартизований формат для зберігання та обміну даними вирівнювання. Вони широко використовуються в різних додатках, і вони, ймовірно, продовжуватимуть бути важливим інструментом на довгі роки.
Різні типи файлів, які можуть використовувати. Розширення SAM ?
. SAM також може бути зразком редагування моди . Це формат файлу, який використовується програмним забезпеченням редагування аудіо редагування мод. Mod Edit - це програма для створення та редагування музичних модулів, які є невеликими файлами, які містять музичні дані у стисненому форматі. Мод редагувати файли Sam ple містять необроблені аудіо дані для Sam Ples, що використовуються в модулі.
Ось таблиця, що підсумовує різні типи файлів, які можуть використовувати. Розширення SAM :
Тип файлу | Опис |
---|
Документ AMI Pro | Документ про обробку слова, створений Samna Ami Pro |
Зразковий файл lmhosts | Зразок файлу для файлу LMHOSTS, який відображає IP -адреси на імена хостів |
Мод редагувати зразок файлу | Зразок файлу для програмного забезпечення для редагування аудіо редагування мод |
Файл вирівнювання/карта (SAM) | Текстовий формат для зберігання біологічних послідовностей, вирівняних до референтної послідовності |
Конкретний тип файлу a. Файл SAM зазвичай можна визначити контекстом, в якому він знайдений. Наприклад, якщо файл розташований у папці, яка містить інші аудіофайли, це, ймовірно, мод редагування Sam ple. Якщо файл розташований у папці, яка містить інші біологічні файли даних, це, ймовірно, файл SAM .
Як відкрити файл SAM ?
Файли SAM можна відкрити за допомогою різноманітних текстових редакторів та програмних пакетів біоінформатики. Деякі популярні варіанти включають:
Блокнот ++: БЕЗКОШТОВНИЙ та редактор тексту з відкритим кодом, який може обробляти великі файли SAM .
Samtools: окремий інструмент для обробки файлів SAM та BAM.
Geneious: комерційний пакет програмного забезпечення Bioinformatics з графічним інтерфейсом користувача для перегляду та аналізу файлів SAM .
Як перетворити файл SAM ?
Файли SAM можуть бути перетворені в різні інші формати, включаючи BAM , SAMGZ та ліжко . Деякі популярні варіанти перетворення файлів SAM включають:
Samtools: можуть перетворити файли SAM у формати BAM, SAM GZ та ліжка.
Bedtools: може перетворити файли SAM у формат ліжка.
Пікард: Біоінформатика на базі Java, що включає інструменти для перетворення файлів SAM у різні формати.
Різниця між файлами SAM та BAM?
Файли SAM та BAM - це формати для зберігання біологічних послідовностей, вирівняних до референтної послідовності. Основна відмінність між двома форматами полягає в тому, що файли SAM -це текстові файли, що читаються на людину, тоді як BAM-файли-двійкові файли. Це робить файли BAM значно меншими та швидшими для читання та обробки. Однак файли BAM не можна безпосередньо редагувати в текстовому редакторі, тому файли SAM все ще корисні для огляду та редагування людини.
Як створити файл SAM ?
Файли SAM можна створити за допомогою різних програмних пакетів Bioinformatics. Деякі популярні варіанти включають:
BWA: Інструмент для вирівнювання коротких зчитувань до референтної послідовності.
Bowtie2: Ще один популярний інструмент для вирівнювання коротких читань до довідкової послідовності.
Novoalign : комерційний вирівнювач з репутацією швидкості та точності.
Як прочитати файл SAM ?
Файли SAM можна прочитати за допомогою різноманітних текстових редакторів та програмних пакетів Bioinformatics. Деякі популярні варіанти включають:
Блокнот ++: може відображати файли SAM у форматі, що читається людиною.
Інструменти SAM : може читати файли SAM та витягувати конкретну інформацію, наприклад, вирівняні читання або показники якості відображення.
Geneious: може надати графічний вигляд інформації про вирівнювання у файлі SAM .
Частини файлу SAM ?
Файл SAM складається з двох основних розділів:
Розділ заголовка: містить метадані про опорну послідовність та вирівняні читання, такі як види, хромосома та довжина послідовності.
Розділ вирівнювання: містить вирівнювання зчитувань до еталонної послідовності. Кожен рядок у розділі вирівнювання відповідає одному вирівняному прочитаному.
Поширені проблеми з файлами SAM ?
Деякі поширені проблеми, які можуть виникати з файлами SAM , включають:
Дублікат читає: читає, що узгоджуються до референтної послідовності кілька разів.
Необхідні читання: читає, які неможливо узгодити до референтної послідовності.
Неправильні вирівнювання: вирівнювання, які не є точними або не відображають справжніх біологічних взаємозв'язків між читаннями та еталонною послідовністю.
Ці проблеми можуть виникнути через різні фактори, такі як помилки послідовності, низьке покриття або складні геномні структури. У вирішенні цих проблем часто потрібні спеціалізовані методи та інструменти для біоінформатики