This study focuses on developing a bioinformatics method based on AA composition in order to explore Sulfation site. A work builds the training model from 483 experimentally and verifies Sulfation proteins by an inquiry in four features including 20D Binary code, AAC, Blosum62, and PSSM. | 18 Khuong T. T. Pham THE PREDICTION OF TYROSINE SULFATION SITE IN PROTOEIN BY ANALYZING AMINO ACID COMPOSITION DỰ ĐOÁN PROTEIN TYROSINE SULFATION DỰA VÀO CÁC PHÂN TÍCH TRÊN AMINO ACID Khuong T. T. Pham The University of Danang, University of Technology and Education; pttkhuong@ Abstract - Nowadays, there are many post-translational modifications (PTM) to be discovered and it hdelps to explore the secrets of life. PTM, a sulfate group is embedded to a Tyrosine residue called Protein Tyrosine Sulfation. The discoveries of these proteins have related to various biological processes and many different diseases. The most recent findings use traditional experimental methods to explore Sulfation sites; however, few factors such as an high-priced cost and the time taken should be mentioned. This study focuses on developing a bioinformatics method based on AA composition in order to explore Sulfation site. A work builds the training model from 483 experimentally and verifies Sulfation proteins by an inquiry in four features including 20D Binary code, AAC, Blosum62, and PSSM. Selected features will be evaluated by 5-fold cross validation and the model constructed by PSSM feature, show the best result with 4 factors: for sensitivity, for specificity, for accuracy and for MCC measurements. Tóm tắt - Ngày nay, có rất nhiều sửa đổi sau dịch thuật (PTM) được phát hiện và điều này giúp khám phá nhiều bí mật của cuộc sống. PTM mà một nhóm sulfate được đính vào amino acid Tyrosine được gọi là Protein sulfation. Những khám phá về các protein này có liên quan đến các quá trình sinh học khác nhau và nhiều bệnh lý khác. Hầu hết các phát hiện gần đây sử dụng các phương pháp thử nghiệm truyền thống để khám phá các vị trí Sulfation; tuy nhiên một số yếu tố cần được đề cập như chi phí cao và thời gian thực hiện. Nghiên cứu này tập trung vào phát triển phương pháp tin sinh học dựa trên thành phần AA để xác định vị trí Sulfation. Mô hình được xây dựng