.SAM - 파일 확장자

.sam는 시퀀스 정렬/맵 파일 또는 모드 편집 샘플 파일입니다 ....

특징 설명
체재 텍스트 기반
목적 참조 서열에 정렬 된 생물학적 서열을 저장한다
응용 프로그램 게놈 어셈블리, 변이 호출, 유전자 발현 분석
중요 요소들 헤더 섹션, 정렬 섹션
헤더 섹션 참조 시퀀스에 대한 메타 데이터가 포함되어 있고 판독 된 판독 값이 포함되어 있습니다
정렬 섹션 각 읽기에 대한 개별 정렬 레코드로 구성됩니다
장점 인간이 읽을 수 있고 쉽게 접근 할 수 있습니다
제한 파일 크기는 클 수 있습니다
대체 형식 BAM (Binary Alignment/Map) 파일 - 더 작고 빠른 처리

SAM 파일이란 무엇입니까?

SAM 파일 또는 시퀀스 정렬/맵 파일은 참조 시퀀스에 정렬 된 생물학적 서열을 저장하기위한 텍스트 기반 형식입니다. 그것은 게놈 어셈블리, 변이 호출 및 유전자 발현 분석과 같은 생물 정보학 응용 분야에서 일반적으로 사용됩니다.

SAM 파일은 두 가지 주요 섹션으로 구성됩니다.

  1. 헤더 섹션 : 이 섹션에는 참조 서열 및 종, 염색체 및 서열 길이와 같은 정렬 된 서열에 대한 정보가 포함되어 있습니다.

  2. 정렬 섹션 : 이 섹션에는 서열의 기준 시퀀스에 대한 정렬이 포함되어 있습니다. 정렬 섹션의 각 라인은 단일 정렬 된 읽기에 해당합니다.

SAM 파일의 정렬 정보는 일련의 필드를 사용하여 표시되며 각 필드는 각각 특정 의미를 갖습니다. 가장 중요한 필드 중 일부는 다음과 같습니다.

  • Qname : 읽기의 고유 식별자
  • rname : 읽기가 정렬 된 참조 시퀀스의 이름
  • POS : 참조 시퀀스에 정렬 된 읽기의 첫 번째베이스의 위치
  • MAPQ : 매핑 품질, 정렬에 대한 신뢰의 척도
  • 시가 : 정렬 작업을 인코딩하는 시가 줄 (예 : 일치, 삽입, 삭제)
  • SEQ : 읽기 순서
  • Qual : 읽기의 각 기준에 대한 phred 품질 점수

SAM 파일은 사람이 읽을 수 있지만보다 효율적인 저장 및 처리를 위해 BAM (Binary Alignment/Map)이라는 이진 형식으로 압축 할 수도 있습니다.

다음은 SAM 파일 레코드의 예입니다.

 QNAMERNAMEPOSMAPQCIGARRNEXTPNEXTTLENSEQQUAL read1chr110060100M*0100TGGATACCCCAATTTACTGACTTACTTGACTT<<<<<<<<<

이 레코드는 "read1"이라는 이름의 읽기가 맵핑 품질이 60 인 위치 100에서 염색체 1에 정렬되었음을 나타냅니다. 시가 문자열 "100m"은 전체 읽기가 참조 시퀀스와 일치 함을 나타냅니다. rnext 및 pnext 필드는 각각 "*"및 0으로 설정되며, 이는 판독 값이 쌍의 엔드 읽기의 일부가 아님을 나타냅니다. Tlen 필드는 100이며, 이는 읽기의 길이가 100베이스임을 나타냅니다. SEQ 필드에는 읽기 시퀀스가 ​​포함되어 있으며 Qual 필드에는 읽기의 각 기지에 대한 Phred 품질 점수가 포함되어 있습니다.

SAM 파일은 정렬 데이터를 저장하고 교환하기위한 표준화 된 형식을 제공하기 때문에 생물 정보학 연구원에게 유용한 도구입니다. 그것들은 다양한 응용 프로그램에서 널리 사용되며 앞으로 몇 년 동안 계속해서 중요한 도구가 될 것입니다.

사용할 수있는 다른 파일 유형. 샘 확장?

. Sam은 MOD 편집 샘플 파일 일 수도 있습니다. 모드 편집 오디오 편집 소프트웨어가 사용하는 파일 형식입니다. Mod Edit은 음악 모듈을 작성하고 편집하기위한 프로그램이며, 이는 압축 형식의 음악 데이터를 포함하는 작은 파일입니다. Mod Edit Sam PLE 파일에는 모듈에 사용되는 SAM PLE에 대한 원시 오디오 데이터가 포함되어 있습니다.

다음은 사용할 수있는 다른 파일 유형을 요약 한 테이블입니다. 확장 :

파일 유형 설명
Ami Pro 문서 Samna Ami Pro가 작성한 단어 처리 문서
lmhosts 샘플 파일 IP 주소를 호스트 이름에 매핑하는 lmhosts 파일의 샘플 파일
모드 편집 샘플 파일 모드 편집 오디오 편집 소프트웨어 용 샘플 파일
시퀀스 정렬/맵 (SAM) 파일 참조 서열에 정렬 된 생물학적 서열을 저장하기위한 텍스트 기반 형식

특정 파일 유형 a. SAM 파일은 일반적으로 발견 된 컨텍스트에 의해 결정될 수 있습니다. 예를 들어, 파일이 다른 오디오 파일이 포함 된 폴더에있는 경우 Sam Ple 파일을 모드로 편집 할 수 있습니다. 파일이 다른 생물학적 데이터 파일이 포함 된 폴더에있는 경우 SAM 파일 일 수 있습니다.

SAM 파일을 여는 방법?

다양한 텍스트 편집기 및 생물 정보학 소프트웨어 패키지를 사용하여 SAM 파일을 열 수 있습니다. 인기있는 옵션은 다음과 같습니다.

  • 메모장 ++ : 대형 SAM 파일을 처리 할 수있는 무료 및 오픈 소스 텍스트 편집기.

  • SAMTOOLS : SAM 및 BAM 파일을 처리하기위한 독립형 도구.

  • Geneious : SAM 파일을보고 분석하기위한 그래픽 사용자 인터페이스가 장착 된 상용 생물 정보학 소프트웨어 패키지.

SAM 파일을 변환하는 방법?

SAM 파일은 BAM , SAMGZBED를 포함한 다양한 형식으로 변환 할 수 있습니다. SAM 파일 변환을위한 인기있는 옵션은 다음과 같습니다.

  • SAMTOOLS : SAM 파일을 BAM, SAM GZ 및 침대 형식으로 변환 할 수 있습니다.

  • BEDTOOLS : SAM 파일을 침대 형식으로 변환 할 수 있습니다.

  • Picard : SAM 파일을 다양한 형식으로 변환하기위한 도구가 포함 된 Java 기반 생물 정보학 툴킷.

SAM 과 BAM 파일의 차이?

SAM 및 BAM 파일은 참조 시퀀스에 정렬 된 생물학적 서열을 저장하기위한 형식입니다. 두 형식의 주요 차이점은 SAM 파일이 사람이 읽을 수있는 텍스트 파일이고 BAM 파일은 이진 파일이라는 것입니다. 이로 인해 BAM 파일을 읽고 처리하는 것이 훨씬 작고 빠릅니다. 그러나 BAM 파일은 텍스트 편집기에서 직접 편집 할 수 없으므로 SAM 파일은 여전히 ​​휴먼 검사 및 편집에 유용합니다.

SAM 파일을 만드는 방법?

SAM 파일은 다양한 생물 정보학 소프트웨어 패키지를 사용하여 만들 수 있습니다. 인기있는 옵션은 다음과 같습니다.

  • BWA : 짧은 판독을 참조 시퀀스에 정렬하는 도구.

  • Bowtie2 : 짧은 판독을 참조 시퀀스에 정렬하기위한 또 다른 인기있는 도구.

  • Novoalign : 속도와 정확성에 대한 명성을 가진 상업적 조정기.

SAM 파일을 읽는 방법?

SAM 파일은 다양한 텍스트 편집기 및 생물 정보학 소프트웨어 패키지를 사용하여 읽을 수 있습니다. 인기있는 옵션은 다음과 같습니다.

  • 메모장 ++ : SAM 파일을 사람이 읽을 수있는 형식으로 표시 할 수 있습니다.

  • SAM 도구 : SAM 파일을 읽고 정렬 된 읽기 또는 매핑 품질 점수와 같은 특정 정보를 추출 할 수 있습니다.

  • Geneious : SAM 파일에서 정렬 정보의 그래픽보기를 제공 할 수 있습니다.

SAM 파일의 일부?

SAM 파일은 두 가지 주요 섹션으로 구성됩니다.

  1. 헤더 섹션 : 참조 서열에 대한 메타 데이터와 종, 염색체 및 서열 길이와 같은 정렬 된 판독 값을 포함합니다.

  2. 정렬 섹션 : 참조 시퀀스에 대한 읽기의 정렬을 포함합니다. 정렬 섹션의 각 라인은 단일 정렬 된 읽기에 해당합니다.

SAM 파일의 일반적인 문제?

SAM 파일에서 발생할 수있는 몇 가지 일반적인 문제는 다음과 같습니다.

  • 중복 읽기 : 참조 시퀀스에 여러 번 정렬 된 읽기.

  • 맵핑되지 않은 읽기 : 참조 시퀀스에 정렬 할 수없는 읽기.

  • 잘못된 정렬 : 정확하지 않거나 읽기와 참조 시퀀스 사이의 진정한 생물학적 관계를 반영하지 않는 정렬.

이러한 문제는 시퀀싱 오류, 낮은 적용 범위 또는 복잡한 게놈 구조와 같은 다양한 요인으로 인해 발생할 수 있습니다. 이러한 문제를 해결하려면 종종 전문 생물 정보학 기술과 도구가 필요합니다.

The 1000 Genomes Project

Biological Sequence

Text-based file

새 파일 확장자 최근 업데이트 3D 이미지 파일 오디오 파일 백업 파일 CAD 파일 Camera Raw 파일 압축 파일 데이터 파일 데이터베이스 파일 개발자 파일 디스크 이미지 파일 인코딩된 파일 실행 파일 글꼴 파일 GIS 파일 게임 파일 기타 파일 페이지 레이아웃 파일 플러그인 파일 래스터 이미지 파일 설정 파일 스프레드시트 파일 시스템 파일 텍스트 파일 벡터 이미지 파일 비디오 파일 웹 파일 전자책 파일