Thứ năm, 25/02/2016 00:44
Số 2 năm 201646 - 53Download

Phân tích biến dị trong hệ gen của 99 cá thể người dân tộc Kinh

Nguyễn Cường* , Nguyễn Đức Long, Nguyễn Nhật Hưng Trịnh Thị Xuân, Chu Hoàng Hà, Trương Nam Hải

*Tác giả liên hệ: Email: cuongnguyen@ibt.ac.vn

Viện Công nghệ sinh học, Viện Hàn lâm Khoa học và Công nghệ Việt Nam

Ngày nhận bài: 27/07/2015; ngày chuyển phản biện: 29/07/2015; ngày nhận phản biện: 31/08/2015; ngày chấp nhận đăng: 03/09/2015

Tóm tắt:

Nghiên cứu này khai thác thông tin về các biến dị di truyền trong bộ gen của 99 người Kinh, được chiết xuất từ dữ liệu của dự án 1.000 hệ gen. Hai tập biến dị đã được lọc ra: tập các biến dị xuất hiện duy nhất trong hệ gen người Kinh (1.895.398 biến dị) (KHVonly) và tập biến dị xuất hiện với tần suất cao hơn 90% trong hệ gen người Kinh (1.556.750 biến dị) (KHV90). Trong đó, biến dị đa hình đơn nucleotide (SNP - Single Nucleotide Polymorphism) chiếm gần 99% tổng số biến dị; có sự tương đồng về phân bố của biến dị trên các nhiễm sắc thể (NST) trong 2 tập KHVonly và KHV90 với NST số 2 mang nhiều biến dị nhất lần lượt là 161.224 và 132.508 biến dị. Mật độ của các biến dị trên các NST không đồng đều, thể hiện ở độ biến động cao về mật độ biến dị tại các vị trí khác nhau trên NST (0-70 ngàn SNP/1 Mb) và có xu hướng tập trung cao ở 2 đầu mút của NST thường hoặc ở giữa NST giới tính. Phân tích vùng chức năng của hệ gen đã dự đoán rằng, chức năng gen nằm trong vùng exon sẽ bị tác động bởi các biến dị trong tập KHVonly nhiều hơn bởi các biến dị trong tập KHV90, lần lượt là 157.311 và 66.123 chức năng, nhưng không tìm thấy SNP gây bệnh trong 2 tập biến dị liên quan đến 27 bệnh di truyền, có thể là do tiêu chí chọn cá nhân có kiểu hình khỏe mạnh tham gia dự án 1.000 hệ gen. Các kết quả trong nghiên cứu này đã được tải lên cơ sở dữ liệu trực tuyến về biến dị di truyền của người Việt tại địa chỉ https://vsnp.ibt.ac.vn. Kết quả của nghiên cứu là nền tảng cho việc mô tả chi tiết toàn bộ hệ gen của người Kinh, là nguồn tài nguyên phong phú và có giá trị cho những nghiên cứu sắp tới về các biến dị di truyền, bệnh di truyền cũng như xác định danh tính ở cộng đồng người Việt.

Từ khóa:

bệnh di truyền, dự án 1.000 hệ gen, giải trình tự gen thế hệ mới, hệ gen người Kinh, khoa học hình sự, tin sinh học.

Chỉ số phân loại:
1.6

Genome analysis of 99 Kinh people

Received: 27 July 2015; accepted: 3 September 2015

Abstract:

The authors report the whole genome analysis of 99 Kinh people extracted from 1,000 Genome Project data. They classified variants into two sets: variants that were uniquely present in Kinh genomes (KHVonly -1,895,398 variants) and variants that were present in more than 90% of Kinh samples (KHV90 -1,556,750 variants), in which 99% were SNP - Single Nucleotide Polymorphism. Both of the variants sets shared a similar pattern in the distribution of variants across chromosomes with chromosome 2 carrying highest number of variants (KHVonly: 161,224; KHV90: 132,508). The distribution of variants in a chromosome was not even, presented by the wide range of density values 0-70,000 SNP/1 Mb with the trend of focusing on both ends of chromosomes (autosomal chromosomes) or focusing in the center (sex chromosomes). Funtional region analysis predicted that gene functions located in the exon regions were affected more by variants in KHVonly (157,311 functions) than by variants in KHV90 (66,123 functions). The authors found that no pathogenic SNP related to 27 genetic diseases, due to the criteria of chosing individuals with heathy appearance for sequencing of 1,000 genomes project. All the results of this study were uploaded to the web browser developed by the research group at the address “https://vsnp.ibt.ac.vn”. The results are the foundation for detailed characterization of whole genome of Kinh people, providing an informative and valuable resource for upcoming researches on genetic variations, identification, and genetic diseases of Vietnamese population.

Keywords:

bioinformatics, forensics, genetic diseases, Kinh people genome, Next Generation Sequencing (NGS), 1,000 genome project.

Classification number:
1.6
Lượt dowload: 300 Lượt xem: 720

Đánh giá

X
(Di chuột vào ngôi sao để chọn điểm)