중화사전망 - 옥스퍼드 사전 - SIFT: 아미노산 치환이 단백질 기능에 영향을 미치는지 예측하는 도구
SIFT: 아미노산 치환이 단백질 기능에 영향을 미치는지 예측하는 도구
SIFT는 아미노산 치환이 단백질 기능에 영향을 미치는지 여부를 예측하기 위한 공개 도구로 A*STAR(Agency?for?Science,?Technology?and?Research) 및 GIS(Genome?Institue)에서 자금을 지원합니다. ?of ?Singapore) Paulien?Ng 그룹 유지 관리, BII(Bioinformatics?Institute) 지원 서버.
SIFT 기능
SIFT는 상동 서열을 기반으로 한 아미노산 치환에서 유해한 치환을 찾아내고, 이 아미노산 치환이 표현형에 영향을 미칠지 여부를 예측합니다. SIFT는 단백질 진화가 단백질 기능과 관련되어 있다는 가정에 기초하고 있으므로, 단백질군을 비교할 때 위치는 보존되어야 하고 중요하지 않은 위치는 다양해야 합니다.
SIFT가 어떤 문제를 분석할 수 있나요?
1. 관심 있는 단백질이 있는 경우 어떤 아미노산 변형이 단백질 기능에 영향을 주기를 바라는지. 시퀀스를 SIFT에 업로드하면 결과 점수 파일에서 유해한 대체 영역이 빨간색으로 강조 표시되고 돌연변이를 위해 이러한 영역을 선택할 수 있습니다.
2. 단일 아미노산 치환을 가진 단백질이 있는 경우, SIFT는 기능 분석 실험을 수행하기 전에 어떤 돌연변이가 표현형에 영향을 미칠지 예측할 수 있습니다.
SIFT는 어떻게 예측을 하나요?
SIFT는 예측하려는 서열과 다중 정렬 정보를 기반으로 서열의 각 위치에서 무해한 치환과 유해한 치환을 예측합니다. SIFT 예측은 다단계 프로세스입니다. 1. 유사한 시퀀스를 검색합니다. 2. 쿼리 시퀀스와 유사한 기능을 가진 가장 관련성이 높은 시퀀스를 선택합니다. 3. 이전 단계에서 선택한 시퀀스를 정렬합니다. 결과적으로 가능한 모든 대안이 정규일 확률이 계산됩니다. 정규 확률이 <0.05인 위치는 유해한 것으로 예측되고, 정규 확률이 ≥0.05인 위치는 무해한 것으로 예측됩니다.
또는 보수성을 기반으로 SIFT 예측을 수행합니다. SIFT의 원래 버전에서는 모든 시퀀스를 추가할 수 있습니다. 현재 버전에서는 사용자가 시퀀스 수에 대한 임계값을 설정하여 시퀀스 수를 제한합니다.
서열 예측이 다양성(낮은 보존 임계값)을 기반으로 하는 경우 고도로 보존된 위치의 치환만 유해한 것으로 예측됩니다. 예측에 사용된 시퀀스가 서로 매우 유사한 경우(높은 보존 임계값) 대부분의 대체가 해로운 것으로 예측됩니다.
실험 데이터를 비교한 결과 대체 정규 확률 <0.05가 유해하다는 사실을 발견하고 예측 임계값을 0.05로 설정했습니다. 대체 정규 우도가 0.05보다 약간 크면 이 대체 정규 가능성을 유해한 것으로 간주할 수 있습니다.
데이터 유형 업로드
단백질 서열(느린 예측 속도) 또는 예측할 서열과 일부 관련 서열(빠른 예측 속도) 또는 예측할 서열을 업로드할 수 있습니다. 예측 및 관련 시퀀스 시퀀스 정렬 결과(빠른 예측). 업로드되는 데이터 유형은 다음과 같습니다.
1.? NCBI?GI?#
SIFT 예측을 위해 NCBI?GI?#id를 업로드할 수 있습니다. 미리 계산된 BLAST 검색과 1분 이내 Feedback을 제공합니다.
2.?순서
단백질 서열(FASTA 형식) 및 관련 서열 세트를 업로드할 수 있습니다.
예측하려는 서열과 관련된 단백질을 알고 있다면, 쿼리 서열과 이들 관련 서열을 업로드해 주시면 계산 속도가 더욱 빨라질 것입니다. 업로드된 파일에서 예측할 시퀀스를 첫 번째 시퀀스(FASTA 형식)로 사용합니다. FASTA 순서 시작 부분의 첫 글자는 특별하다는 점에 유의하세요. 예를 들어 다음 두 시퀀스를 살펴보겠습니다.
>A8T644PCSK9?PANTR?PROPROTEIN?CONVERTASE?SUBTILISIN?KEXIN?TYPE?9?OS=PAN?TROGLODYTES
>A8T655PCSK9?PANPA?PROPROTEIN?CONVERTASE?SUBTILISIN?KEXIN?TYPE ?9?OS=PAN?PANISCUS
이 두 시퀀스는 모두 SP로 시작하고 시스템에서 이를 구별할 수 없기 때문에 필수적입니다.
>SP?A8T644PCSK9?PANTR?PROPROTEIN?CONVERTASE?SUBTILISIN?KEXIN?TYPE?9?OS=PAN?TROGLODYTES
>SP?A8T655PCSK9?PANPA?PROPROTEIN?CONVERTASE?SUBTILISIN ?KEXIN?TYPE?9?OS=PAN?PANISCUS
3. 다중 정렬 결과
관심 서열에 대한 정렬 결과가 다중인 경우 CLUSTAL, ?Upload를 사용할 수 있습니다. MSF 또는 FASTA 형식으로. 단백질 서열은 파일의 맨 위에 배치되어야 하며 정렬 길이는 예측할 단백질의 길이와 일치해야 하며 예측할 단백질 서열에 공백이 없어야 합니다.
4.?교체
SIFT는 점수를 기반으로 대체가 유해한지 무해한지 예측합니다. 치환 형식은 X#Y이며, X는 원래 아미노산, #은 대체 위치, Y는 새로운 아미노산을 나타냅니다. 한 줄에 하나만 대체할 수 있습니다. 아래 그림과 같습니다.
M1Y
K3S
T4P
SIFT 출력 결과
치환된 아미노산의 SIFT 예측
출력 결과 세부정보
SIFT 점수 값 범위는 0~1입니다. 점수가 0.05 이하이면 아미노산 치환이 0.05보다 큰 것으로 예측됩니다. 무해하다.
중앙값 순서 정보의 값 범위는 0~4.32이며, 이상적인 값 범위는 2.75~3.5입니다. 중간 서열 정보는 예측된 서열 다양성의 척도이다. 값이 3.25보다 크면 경고가 표시됩니다. 이는 예측이 상관 관계가 매우 높은 계열을 기반으로 함을 나타냅니다.
위치의 시퀀스 번호 예측 위치에 하나의 아미노산이 있는 시퀀스의 수입니다. SIFT는 자동으로 서열을 선택하지만 치환이 단백질 서열의 시작이나 끝에 있는 경우 일부 서열만 기준을 충족합니다. 이 칼럼은 이러한 측면을 예측합니다.
예: 단일 단백질 서열 예측
단일 단백질 서열을 예로 들어 SIFT를 통한 서열 예측 결과를 확인하세요.
단계,
1. 아래와 같이 FASTA 형식으로 단백질 서열을 붙여넣습니다. FASTA 형식의 파일을 업로드할 수도 있습니다.
2. 매개변수 설정
3. 제출 후 결과를 기다립니다. SIFT 예측 결과 보고서는 아래 그림과 같이 각 결과를 하나씩 볼 수 있습니다. 이러한 결과를 바탕으로 특정 위치의 아미노산을 선택적으로 돌연변이시켜 단백질 기능을 예측할 수 있습니다.
(1) 이 단백질 서열의 경우, 각 위치의 정상적인 아미노산 치환 가능성 표는 아래 그림(가로채인 부분)에 나와 있습니다.
위 그림에서 각 행은 참조 단백질의 해당 위치를 나타내며, 각 위치 아래에는 이 서열의 아미노산이 있습니다. 각 열은 20개의 아미노산 중 하나를 나타냅니다. 각 항목은 아미노산 치환의 특정 위치에 해당하는 점수를 등록하고 유해한 치환은 빨간색으로 강조 표시됩니다.
(2) 위치 예측
아미노산 치환이 유해한지 여부에 대한 임계값은 0.05입니다. 아미노산 색상 설명: 검은색은 비극성 아미노산, 녹색은 극성의 전하를 띠지 않는 아미노산, 빨간색은 염기성 아미노산, 파란색은 산성 아미노산을 나타냅니다. 대문자는 정렬에 존재하는 아미노산을 나타내고, 소문자는 예측에서 나온 것입니다. "Seq?Rep"은 기본 아미노산을 포함하는 서열 단편입니다. 짧은 단편은 이 위치에 공백이 많거나 정보가 거의 없기 때문에 비교할 수 없음을 나타냅니다.