Was ist eine SAM -Datei?
Eine SAM- Datei oder eine Sequenz-Ausrichtung/Kartendatei ist ein textbasiertes Format zum Speichern biologischer Sequenzen, die an einer Referenzsequenz ausgerichtet sind. Es wird üblicherweise in Bioinformatikanwendungen wie Genomanordnung, Variantenaufruf und Genexpressionsanalyse verwendet.
Eine SAM -Datei besteht aus zwei Hauptabschnitten:
Headerabschnitt: Dieser Abschnitt enthält Informationen zur Referenzsequenz und die ausgerichteten Sequenzen wie Spezies, Chromosom und Sequenzlänge.
Ausrichtung Abschnitt: Dieser Abschnitt enthält die Ausrichtung der Sequenzen auf die Referenzsequenz. Jede Zeile im Abschnitt Ausrichtung entspricht einer einzigen ausgerichteten Lektüre.
Die Ausrichtungsinformationen in einer SAM -Datei werden unter Verwendung einer Reihe von Feldern dargestellt, von denen jede eine bestimmte Bedeutung hat. Einige der wichtigsten Felder umfassen:
- Qname: Die eindeutige Kennung für die Lektüre
- RNAME: Der Name der Referenzsequenz, auf die das Lesen ausgerichtet ist
- POS: Die Position der ersten Basis in der Lektüre, die auf die Referenzsequenz ausgerichtet ist
- MAPQ: Die Mapping -Qualität, die ein Maß für das Vertrauen in die Ausrichtung ist
- Zigarre: Die Zigarrenschnur, die die Ausrichtungsoperationen codiert (z. B. Match, Insertion, Löschung)
- SEQ: Die Lesesequenz
- Qual
SAM- Dateien sind menschlich lesbar, können aber auch in ein binäres Format namens BAM (binäre Ausrichtung/MAP) für eine effizientere Speicherung und Verarbeitung komprimiert werden.
Hier ist ein Beispiel für einen SAM -Datei -Datensatz:
QNAMERNAMEPOSMAPQCIGARRNEXTPNEXTTLENSEQQUAL read1chr110060100M*0100TGGATACCCCAATTTACTGACTTACTTGACTT<<<<<<<<<
Dieser Datensatz zeigt an, dass eine LEAD mit dem Namen "Read1" an Position 100 mit einer Zuordnungsqualität von 60 an Chromosom 1 ausgerichtet ist. Die Zigarrenzeichenfolge "100m" zeigt an, dass die gesamte LES -LEAD mit der Referenzsequenz übereinstimmt. Die Felder von RNEXT und PNEXT sind auf "*" bzw. 0 festgelegt, was darauf hinweist, dass die LESER nicht Teil eines Paired-End-Lesens ist. Das Tlen -Feld beträgt 100, was darauf hinweist, dass die Lektüre 100 Basen lang ist. Das SEQ -Feld enthält die Lesesequenz und das Qual -Feld enthält die PHRD -Qualitätswerte für jede Basis in der LESER.
SAM -Dateien sind ein wertvolles Instrument für Bioinformatikforscher, da sie ein standardisiertes Format zum Speichern und Austausch von Ausrichtungsdaten bieten. Sie werden in einer Vielzahl von Anwendungen häufig eingesetzt und sind wahrscheinlich in den kommenden Jahren weiterhin ein wichtiges Instrument.
Verschiedene Dateitypen, die die verwenden können. SAM -Erweiterung?
. SAM kann auch eine Mod -Beispieldatei für Mod Bearbeiten sein. Es handelt sich um ein Dateiformat, das von der Mod Bearbeiten von Audio -Bearbeitungssoftware verwendet wird. Mod Edit ist ein Programm zum Erstellen und Bearbeiten von Musikmodulen, bei denen es sich um kleine Dateien handelt, die Musikdaten in einem komprimierten Format enthalten. Mod bearbeiten Sam Ple -Dateien enthalten die RAW -Audiodaten für die in einem Modul verwendeten SAM -PLES.
Hier ist eine Tabelle, die die verschiedenen Dateitypen zusammenfasst, die die verwenden können. SAM -Erweiterung:
Dateityp | Beschreibung |
---|
AMI Pro -Dokument | Ein Textverarbeitungsdokument, das von Samna Ami Pro erstellt wurde |
LMHOSTS -Beispieldatei | Eine Beispieldatei für die LMHOSTS -Datei, die IP -Adressen an Hostnames ordnet |
Beispieldatei mod bearbeiten | Eine Beispieldatei für die Mod -Software zur Bearbeitung von Audio -Bearbeitung von Mod bearbeiten |
Sequenzausrichtung/MAP (SAM) -Datei | Ein textbasiertes Format zum Speichern biologischer Sequenzen, die an einer Referenzsequenz ausgerichtet sind |
Der spezifische Dateityp von a. Die SAM -Datei kann normalerweise durch den Kontext bestimmt werden, in dem sie gefunden wird. Wenn sich die Datei beispielsweise in einem Ordner befindet, der andere Audio -Dateien enthält, handelt es sich wahrscheinlich um eine Mod -SAM PLE -Datei bearbeiten. Wenn sich die Datei in einem Ordner befindet, der andere biologische Datendateien enthält, handelt es sich wahrscheinlich um eine SAM -Datei.
Wie öffne ich eine SAM -Datei?
SAM -Dateien können mit einer Vielzahl von Text -Editoren und Bioinformatik -Softwarepaketen geöffnet werden. Einige beliebte Optionen sind:
Notepad ++: Ein kostenloser und Open-Source-Texteditor, der große SAM- Dateien verarbeiten kann.
SAMTOOLS: Ein eigenständiges Tool zur Verarbeitung von SAM- und BAM -Dateien.
Geneig: Ein kommerzielles Bioinformatik -Softwarepaket mit einer grafischen Benutzeroberfläche zum Anzeigen und Analysieren von SAM -Dateien.
Wie konvertiere ich eine SAM -Datei?
SAM -Dateien können in eine Vielzahl anderer Formate konvertiert werden, einschließlich BAM , Samgz und Bett . Einige beliebte Optionen zum Konvertieren von SAM -Dateien umfassen:
SAMTOOLS: Kann SAM -Dateien in BAM-, SAM GZ- und Bettformate konvertieren.
Bedtools: Kann SAM -Dateien in das Bettformat umwandeln.
Picard: Ein Java-basierter Bioinformatik-Toolkit, das Tools zum Konvertieren von SAM- Dateien in verschiedene Formate enthält.
Unterschied zwischen Sam- und BAM -Dateien?
SAM- und BAM -Dateien sind beide Formate zum Speichern biologischer Sequenzen, die auf eine Referenzsequenz ausgerichtet sind. Der primäre Unterschied zwischen den beiden Formaten besteht darin, dass SAM- Dateien menschlich-lesbare Textdateien sind, während BAM-Dateien Binärdateien sind. Dies macht BAM -Dateien deutlich kleiner und schneller zu lesen und zu verarbeiten. BAM -Dateien können jedoch nicht direkt in einem Texteditor bearbeitet werden, sodass SAM -Dateien für die menschliche Inspektion und Bearbeitung immer noch nützlich sind.
Wie erstelle ich eine SAM -Datei?
SAM -Dateien können mit einer Vielzahl von Bioinformatik -Softwarepaketen erstellt werden. Einige beliebte Optionen sind:
BWA: Ein Werkzeug zum Ausrichten von kurzen Lesevorgängen auf eine Referenzsequenz.
Bowtie2: Ein weiteres beliebtes Tool zum Ausrichten von kurzen Lesevorgängen auf eine Referenzsequenz.
NovoAnign : Ein kommerzieller Aligner mit einem Ruf für seine Geschwindigkeit und Genauigkeit.
Wie lese ich eine SAM -Datei?
SAM -Dateien können mit einer Vielzahl von Text -Editoren und Bioinformatik -Softwarepaketen gelesen werden. Einige beliebte Optionen sind:
Notepad ++: Kann SAM- Dateien in einem menschlich-lesbaren Format anzeigen.
SAM -Tools: Sie können SAM -Dateien lesen und bestimmte Informationen extrahieren, z. B. die ausgerichteten Lesevorgänge oder die Bewertungen der Zuordnungsqualität.
Geneig: Kann eine grafische Ansicht der Ausrichtungsinformationen in einer SAM -Datei bereitstellen.
Teile einer SAM -Datei?
Eine SAM -Datei besteht aus zwei Hauptabschnitten:
Headerabschnitt: Enthält Metadaten über die Referenzsequenz und die ausgerichteten Reads wie Spezies, Chromosom und Sequenzlänge.
Ausrichtung Abschnitt: Enthält die Ausrichtung der Lesevorgänge auf die Referenzsequenz. Jede Zeile im Abschnitt Ausrichtung entspricht einer einzigen ausgerichteten Lektüre.
Häufige Probleme mit SAM -Dateien?
Einige häufige Probleme, die bei SAM -Dateien auftreten können, sind:
Duplikat liest sich: liest sich mehrmals mit der Referenzsequenz aus.
Abgebildete Lesevorgänge: Lesevorgänge, die nicht auf die Referenzsequenz ausgerichtet werden können.
Falsche Ausrichtungen: Ausrichtungen, die nicht genau sind oder die tatsächlichen biologischen Beziehungen zwischen den Lesevorgängen und der Referenzsequenz nicht widerspiegeln.
Diese Probleme können aufgrund verschiedener Faktoren auftreten, wie z. B. Sequenzierungsfehler, geringe Abdeckung oder komplexe genomische Strukturen. Die Behebung dieser Probleme erfordert häufig spezielle Bioinformatik -Techniken und -Tools