Mở đầu
Panax là một trong những chi quan trọng thuộc họ Araliaceae, bao gồm nhiều loài cây dược liệu có giá trị kinh tế cao. Một số loài cây dược liệu nổi tiếng trong chi Panax được biết đến như sâm Hàn Quốc (P. ginseng), tam thất (P. notoginseng), sâm Vũ Diệp (P. bipinnatifidus), sâm Nhật Bản (P. japonicus), sâm Mỹ (P. quinquefolius) và sâm Ngọc Linh (P. vietnamensis) thuộc nhánh Panax; giảm sâm (P. pseudoginseng) và tam thất hoang (P. stipuleanatus) thuộc nhánh Pseudoginseng. Nhìn chung, các loài sâm này có giá trị và tác dụng dược lý khác nhau, do đó có thể bị nhầm lẫn hoặc cố ý tráo đổi trong quá trình sử dụng. Vì vậy, vấn đề nhận dạng các loài sâm luôn được đặt lên hàng đầu, nhất là trong quá trình bào chế, gieo trồng, giao dịch hay liên quan đến công tác chọn giống sâm. Trước đây, một số nghiên cứu đã được tiến hành nhằm mô tả hình thái nhận dạng của từng giống sâm. Tuy nhiên, cách tiếp cận truyền thống này còn gặp rất nhiều vấn đề do ảnh hưởng của yếu tố môi trường. Sự ra đời của công cụ chỉ thị phân tử đã tỏ rõ ưu thế trong công tác phân loại và nhận dạng các giống sâm, bởi chúng không chịu ảnh hưởng từ điều kiện nuôi trồng, đồng thời có thể thao tác trên một số lượng lớn mẫu nhất định với độ chính xác cao. Trong bài viết này, nhóm tác giả tóm tắt những thành tựu quan trọng trong nghiên cứu ứng dụng công cụ chỉ thị phân tử nhằm kiểm định và phân tích đa dạng di truyền của các loài sâm trên thế giới cũng như những giống sâm Hàn Quốc.
Thành tựu trong nhận dạng chi Panax bằng chỉ thị phân tử
Công cụ RFLP
Phân tích đa hình chiều dài đoạn cắt giới hạn (Restriction fragment length polymorphism - RFLP) là một phương pháp nhận biết trình tự ADN cụ thể dựa trên sự khác nhau về chiều dài của các đoạn ADN được tạo ra nhờ enzyme cắt giới hạn. Đây là kỹ thuật khá đơn giản, không tốn nhiều thời gian và yêu cầu ít ADN, được sử dụng khá phổ biến để nhận biết và phân loại các loài. Được phát triển lần đầu tiên vào năm 1985, kỹ thuật RFLP đã được ứng dụng trên nhiều đối tượng thực vật. Năm 1997, RFLP lần đầu tiên được ứng dụng để so sánh các đoạn trình tự mã hóa 18S rRNA, có kích thước khoảng 500 bp của giống sâm Hàn Quốc (H. Fushimi 14), 2 giống P. japonicus (H. Fushimi 13 và 19), P. quinquefolius (H. Fushimi 15) và một số mẫu sản phẩm thương mại bào chế từ sâm (bảng 1) [1]. Sự sai khác của đoạn mã hóa 18S rRNA cũng được nghiên cứu trên P. ginseng trồng tại Trung Quốc và Hàn Quốc [2]. Từ lâu, việc hoán đổi các giống sâm và một số loài có hình thái tương tự, như hoa phấn (Mirabilis jalapa), thương lục (Phytolacca acinosa), thương lục Mỹ (P. americana) và cát cánh (Platycodon grandiflorus) đã diễn ra rất phổ biến trên thị trường [3, 4]. Một trong những nỗ lực đã được ghi nhận là ứng dụng RFLP trong phân tích vùng ITS1-5, 8S-ITS2 từ rễ khô của 6 mẫu sâm và so sánh với M. jalapa và P. acinosa [3]. Đoạn trình tự này được dùng khá phổ biến trong xác định các giống sâm Hàn Quốc với các loài thuộc chi Panax nhằm phục vụ công tác lai tạo [5]. Để phân biệt P. ginseng với P. americana và P. grandiflorus, các nhà khoa học Trung Quốc đã khuếch đại gen mục tiêu bằng kỹ thuật PCR-RFLP nhằm giúp xác định đột biến điểm và đánh giá sự sai khác của đoạn trình tự 5S rDNA [4] (bảng 1). Bên cạnh đó, một số gen lục lạp khác, điển hình như psbA và rbcL cũng được sử dụng để nhận biết các giống sâm [6] (bảng 1). Các nghiên cứu cho thấy, PCR-RFLP có thể nhận dạng giữa các loài Panax hoặc với một số loài tương tự sâm, tuy nhiên khả năng phân biệt giữa các giống cùng loài lại chưa hiệu quả [5, 7].
Kỹ thuật phân tích ADN đa hình nhân bản ngẫu nhiên (Random amplification of polymorphic ADN - RAPD) được phát triển dựa trên nguyên lý sử dụng mồi đơn chứa 9-12 nucleotide ngẫu nhiên (tối thiểu là 4 nucleotide) để nhân bản các đoạn ADN bổ sung bất kỳ trong genome. Trong giai đoạn trước, RAPD đã trở thành một công cụ phổ biến để phân tích đa dạng di truyền trong quần thể cây trồng hoặc giữa các giống với ưu điểm về thời gian, chi phí và chỉ đòi hỏi một lượng mẫu nhỏ. Từ năm 1997, RAPD đã bắt đầu được sử dụng để nghiên cứu trên chi Panax nhằm phân biệt rễ P. ginseng khô thu thập từ 4 vùng sinh thái khác nhau tại Trung Quốc và Hàn Quốc [2]. Với mục tiêu phân tích đa dạng di truyền hỗ trợ công tác chọn tạo giống, một số lượng lớn chỉ thị RAPD đã được sử dụng để đánh giá các quần thể sâm P. quinquefolius tại Canada [8] và Trung Quốc [9]. Cho đến nay, rất nhiều quần thể P. ginseng từ nhiều khu vực khác nhau đã được thu thập để đánh giá đa dạng di truyền và sự khác biệt giữa các giống bằng chỉ thị RAPD [10].
Chỉ thị RAPD được sử dụng rất phổ biến trong phân tích đa dạng di truyền giữa Panax spp. do ưu điểm về giá thành, không đòi hỏi trình tự genome của đối tượng và có thể phân tích trên số lượng mẫu lớn. Tuy nhiên, gần như tất cả các chỉ thị RAPD đều là chỉ thị di truyền trội, rất khó để xác định đoạn ADN được nhân là dị hợp (1 bản copy) hay đồng hợp (2 bản copy), nghĩa là không có khả năng phân biệt được cá thể đồng và dị hợp tử. Vì vậy, việc phân biệt giữa các giống thuộc cùng một loài Panax bằng chỉ thị RAPD vẫn còn có những hạn chế [7].
Công cụ STS
Kỹ thuật xác định vị trí dán nhãn trình tự (Sequence tagged site - STS) được thực hiện dựa trên việc nhân bản các đoạn ADN ngắn (200-500 bp) của các vị trí đã xác định trên genome bằng PCR. Chỉ thị đồng trội STS cho phép nhân bản cả locus bằng cách sử dụng cặp mồi PCR có trình tự đặc trưng cho locus đó. Chính vì thế, để phân tích genome giữa các Panax spp., thư viện cDNA cần phải được thiết lập để xác định và thiết kế các cặp mồi STS đặc hiệu [11]. Cụ thể, mẫu lá từ 6 giống P. ginseng (Hàn Quốc), 2 loài P. quinquefolius (Hoa Kỳ) và P. notoginseng (Trung Quốc) được sử dụng để tách chiết và xây dựng thư viện cDNA [11]. Trên tổng số 214 cặp mồi STS thiết kế theo Primer 3, 4 cặp chỉ thị, bao gồm UFGp163, MFGp108, MFGp81A và UFGp156A đã được xác định có thể phân biệt được một cách chính xác kiểu gen của các mẫu tại 4 vị trí locus [11]. Kết quả của nghiên cứu này đã đặt nền móng cơ bản cho việc tối ưu hóa bộ chỉ thị này thành kit PCR đa mồi (multiplex PCR) nhằm phân biệt các mẫu Panax.
Công cụ SSR
Trong thực vật, hiện tượng lặp lại một trật tự nucleotide (1-10 bp) đơn giản diễn ra rất phổ biến. Dựa trên các trình tự này, kỹ thuật phân tích trình tự lặp đơn (Simple sequence repeats - SSR) cho phép phát hiện được sự đa hình về kích thước giữa các trình tự lặp đơn giản, từ đó xây dựng bản đồ liên kết tính trạng mong muốn [7]. Năm 2004, nhóm nghiên cứu Hàn Quốc đã xây dựng thành công thư viện nhiễm sắc thể nhân tạo vi khuẩn cho sâm Hàn Quốc để thiết kế các chỉ thị SSR đặc hiệu trong phân biệt các giống sâm Hàn Quốc [12]. Tiếp tục sàng lọc trên thư viện genome, rất nhiều chỉ thị SSR đã được xác định, trong đó bao gồm các chỉ thị SSR cho kết quả đa hình giữa các giống sâm Hàn Quốc và một số chỉ thị SSR đặc hiệu cho phép phân biệt các giống sâm Hàn Quốc với P. quinquefolius đã được đề xuất [13-15]. Ở giai đoạn tiếp theo, công cụ SSR tỏ ra rất hiệu quả trong những vấn đề liên quan đến bảo hộ sản phẩm sâm Hàn Quốc [7]. Kim và cộng sự (2012) đã xây dựng bộ 19 chỉ thị SSR để đánh giá 9 giống sâm đã đăng ký tại Hàn Quốc [16]. Kết quả của nghiên cứu này còn cho phép xác định được con lai F1 giữa 2 giống, tạo tiền đề quan trọng cho công tác lai tạo giống sâm chất lượng cao [16]. Tại Trung Quốc, nhu cầu kiểm định các giống sâm cũng gặp một số khó khăn tương tự. Một số nghiên cứu bước đầu đã xây dựng được hệ thống chỉ thị SSR để phân loại các giống P. ginseng hoặc phân biệt giữa P. notoginseng, P. stipuleanatus, P. bipinnatifidus với một số loài có quan hệ gần với chi Panax [17, 18]. Tuy nhiên, nhược điểm cơ bản của phân tích SSR là thời gian và đòi hỏi kỹ năng kiểm tra sản phẩm điện di trên polyacrylamide [7].
Công cụ SNP
Chỉ thị đa hình các nucleotide đơn (Single nucleotide polymorphism - SNP) là những điểm sai khác khi phân tích chi tiết các trình tự ADN nghiên cứu. Những thay đổi này có thể do hiện tượng đột biến điểm làm thêm, bớt hoặc thay thế các nucleotide tạo ra sự sai khác rất nhỏ giữa các cá thể trong quần thể. Vì vậy, SNP được sử dụng rất nhiều trong nghiên cứu sự khác biệt giữa các loài trong chi Panax, hoặc giữa những giống sâm Hàn Quốc. Trong đó, Chunpoong là một trong những giống sâm nổi tiếng của Hàn Quốc, là nguồn nguyên liệu tốt để tạo ra hồng sâm Hàn Quốc. Để phân biệt Chunpoong với một số giống khác như Yunpoong, Gopoong, Sunpoong, Sunwon, Sunweon, Sunhyang (phát triển từ dòng Jakyung), Chungsun (thuộc dòng Chungkyung) và Gumpoong (chọn từ dòng Hwangsook), các nhà khoa học Hàn Quốc đã xác định các SNP từ vùng intron 4 của gen nad7 trên ty thể mã hóa cho tiểu phần của phức hợp NADH dehydrogenase [19]. Tương tự, nhằm phân biệt Yunpoong với các giống sâm Hàn Quốc và P. quinquefolius, các SNP từ vùng exon của gen mã hóa enzyme glyceraldehyde 3-phosphate dehydrogenase đã được xác định [20]. Kết hợp với phương pháp tách nhanh sử dụng NaOH-Tris và kỹ thuật Realtime-PCR với cặp mồi yunF/yunR2 đã được chứng minh có thể sàng lọc ra Yunpoong từ một lượng lớn mẫu sâm kiểm định với độ chính xác cao [20]. Kỹ thuật Realtime-PCR đã được phát triển với đoạn dò huỳnh quang (TaqMan-MGB probe) và những cặp mồi đặc hiệu đã được sử dụng rất phổ biến trong kiểm định các giống sâm Hàn Quốc phát triển từ dòng Jakyung [21]. Gần đây, rất nhiều các SNP đã được tìm thấy trên đoạn intron của nhãn xác định trình tự biểu hiện (EST, Expressed sequence tag) [22] dựa trên genome tham chiếu của giống Chunpoong.
Thay lời kết
Có thể thấy rằng, các phương pháp nhận dạng hình thái truyền thống thường rất dễ nhầm lẫn bởi ảnh hưởng của điều kiện ngoại cảnh và sự giống nhau giữa các giống sâm. Chính vì vậy, để chuẩn bị cho việc mở cửa thị trường trao đổi tự do sâm và các sản phẩm từ sâm, chúng ta cần phải có và hoàn thiện ngay những hệ thống quản lý, giám định sâm và các sản phẩm bào chế từ sâm. Dưới góc độ nghiên cứu, một số điểm mấu chốt đã được rút ra từ nội dung bài viết như sau:
Thứ nhất, sử dụng chỉ thị phân tử không chỉ có ý nghĩa trong việc xác định mối quan hệ gần gũi giữa các loài mà còn đáp ứng mục tiêu lập bản đồ di truyền liên kết với tính trạng mong muốn phục vụ công tác chọn giống sâm chất lượng cao. Trong đó, một số loại chỉ thị không phù hợp cho phân loại giống trên một số lượng lớn cá thể. Chỉ thị RAPD dễ bị ảnh hưởng bởi sự thay đổi nhỏ trong phản ứng PCR, trong khi RFLP đòi hỏi thao tác phức tạp với các enzyme cắt giới hạn [7]. Các loại chỉ thị đồng trội, như STS, SSR và SNP cho phép phát hiện sự sai khác giữa các giống, vì vậy chúng được sử dụng nhiều trong phân biệt các giống sâm Hàn Quốc để có thể tránh sự nhầm lẫn trong công tác lai giống [22].
Thứ hai, những bước tiến mạnh mẽ từ công nghệ giải trình tự thế hệ mới (next-generation sequencing - NGS) đã cho phép các nhà khoa học nắm rõ được thông tin di truyền của các loài Panax. Gần đây, hệ gen lục lạp của sâm Ngọc Linh đã được giải mã một cách đầy đủ [23, 24]. Đây được xem là một bước tiến lớn để đi tới việc kiểm định sâm Ngọc Linh với các giống sâm khác nhờ hệ gen ngoài nhân. Một số nghiên cứu đã rất nhanh chóng được công bố nhằm phân biệt các loài sâm (trong đó có sâm Ngọc Linh) [25, 26]. Như vậy, trong thời gian tới, việc thiết lập bộ chỉ thị phân tử đặc trưng trên genome sẽ củng cố thêm những dữ liệu quan trọng để xác định sâm Ngọc Linh thật, giả nói riêng và các giống sâm nói chung. Bên cạnh đó, những dữ liệu trình tự từ NGS cũng giúp chúng ta có thể xác định nhanh chóng và dễ dàng các sai khác giữa các giống bằng SNP, SSR [7]. Vì vậy, bài toán này trên các đối tượng sâm Việt Nam, trong đó có sâm Ngọc Linh là hoàn toàn có khả thi.
Thứ ba, sự phát triển của công nghệ thông tin đã tạo ra những lợi thế rất lớn cho việc thiết lập cơ sở dữ liệu trực tuyến về sâm. Kể từ khi genome của giống sâm Chunpoong được giải mã hoàn chỉnh, dữ liệu về chú giải chức năng gen, hệ phiên mã được sử dụng để xây dựng cổng thông tin sâm Hàn Quốc (Ginseng Genome Database, http://www.ginsengdb.snu.ac.kr/) [27]. Đây được xem là một hệ tham chiếu quan trọng trong thiết kế các cặp chỉ thị đặc hiệu để nhận dạng loài Panax nói chung và sâm Việt Nam nói riêng.
Cuối cùng, nhu cầu kiểm chứng sâm ngoài thực địa luôn là một bài toán cho các thử nghiệm sinh học phân tử trong phòng thí nghiệm. Việc thu thập, bảo quản, vận chuyển mẫu đến phòng thí nghiệm, tách chiết ADN và thao tác PCR mất nhiều thời gian sẽ làm giảm hiệu quả của công tác kiểm chứng, vì vậy đòi hỏi kỹ thuật sinh học phân tử đơn giản, hiệu quả và nhanh ngay trên hiện trường. Gần đây, kỹ thuật tách chiết và tinh sạch nucleic acid mới dựa trên cellulose [28] kết hợp với phương pháp khuếch đại đẳng nhiệt nhờ enzyme polymerase và recombinase [29] đã được phát triển nhằm xác định gen mục tiêu trong thời gian cực ngắn với độ chính xác cao mà không đòi hỏi những trang thiết bị hiện đại. Đây có thể được xem như một hướng hoàn toàn khả thi trong kiểm định mẫu sâm trên thực địa.
TÀI LIỆU THAM KHẢO
[1] H. Fushimi, et al. (1997), "Application of PCR-RFLP and MASA analyses on 18S ribosomal RNA gene sequence for the identification of three Ginseng drugs", Biol. Pharm. Bull., 20(7), pp.765-769.
[2] J.Y. Um, et al. (2001), "Molecular authentication of Panax ginseng species by RAPD analysis and PCR-RFLP", Biol. Pharm. Bull., 24(8), pp.872-875.
[3] F. Ngan, et al. (1999), "Molecular authentication of Panax species", Phytochem., 50(5), pp.787-791.
[4] Y. Diao, et al. (2009), "Authentication of Panax ginseng from its adulterants by PCR-RFLP and ARMS", Planta Med., 75(5), pp.557-560.
[5] O.T. Kim, et al. (2007), "Molecular authentication of ginseng cultivars by comparison of internal transcribed spacer and 5.8S rDNA sequences", Plant Biotechnol. Rep., 1(3), pp.163-167.
[6] D.C. Yang, S.K. Moo (2003), "DNA analysis of ginseng using PCR-aided RFLP technology", J. Ginseng Res., 27(3), pp.146-150.
[7] I.H. Jo, et al. (2017), "Applications of molecular markers in the discrimination of Panax species and Korean ginseng cultivars (Panax ginseng)", J. Ginseng Res., 41(4), pp.444-449.
[8] D. Bai, J. Brandle, R. Reeleder (1997), "Genetic diversity in North American ginseng (Panax quinquefolius L.) grown in Ontario detected by RAPD analysis", Genome, 40(1), pp.111-115.
[9] A.J. Shao, et al. (2004), "Genetic analysis of cultivated ginseng population with the assistance of RAPD technology", China J. Chin. Mater. Med., 29(11), pp.1033-1036.
[10] K.H. Bang, et al. (2013), "Analysis of genetic polymorphism of Korean ginseng cultivars and breeding lines using RAPD markers", Korean J. Intl. Agri., 25(2), pp.184-193.
[11] K.H. Bang, et al. (2010), "Construction of genomic DNA library of Korean ginseng (Panax ginseng C.A. Meyer) and development of sequence-tagged sites", Biol. Pharm. Bull., 33(9), pp.1579-1588.
[12] C.P. Hong, et al. (2004), "Construction of a BAC library of Korean ginseng and initial analysis of BAC-end sequences", Mol. Genet. Genomics, 271(6), pp.709-716.
[13] J. Kim, et al. (2007), "Identification of new microsatellite markers in Panax ginseng", Mol. Cells, 24(1), pp.60-68.
[14] N.V. Dan, et al. (2010), "Development and characterization of new microsatellite markers in Panax ginseng (C.A. Meyer) from BAC end sequences", Conserv. Genet., 11(3), pp.1223-1225.
[15] K.H. Ma, et al. (2007), "Development and characterization of new microsatellite markers for ginseng (Panax ginseng C.A. Meyer)", Conserv. Genet., 8(6), pp.1507-1509.
[16] N.H. Kim, et al. (2012), "EST-SSR marker sets for practical authentication of all nine registered ginseng cultivars in Korea", J. Ginseng Res., 36(3), pp.298-307.
[17] P. Jiang, et al. (2016), "Development of highly transferable microsatellites for Panax ginseng (Araliaceae) using whole-genome data", Appl. Plant Sci., 4(11), doi:10.3732/apps.1600075.
[18] Y.C. Jun, et al. (2008), "Development of an EST-SSR marker in Panax ginseng", Chin. J. Agric. Biotechol., 5(2), pp.175-181.
[19] H. Wang, et al. (2009), "Molecular identification of the Korean ginseng cultivar "Chunpoong" using the mitochondrial nad7 intron 4 region", Mitochondrial DNA, 20(2-3), pp.41-45.
[20] H. Sun, et al. (2011), "A simple and rapid technique for the authentication of the ginseng cultivar, Yunpoong, using an SNP marker in a large sample of ginseng leaves", Gene, 487(1), pp.75-79.
[21] I.H. Jo, et al. (2011), "Rapid identification of ginseng cultivars (Panax ginseng Meyer) using novel SNP-based probes", J. Ginseng Res., 35(4), pp.504-513.
[22] H. Wang, G. Li, W.S. Kwon, D.C. Yang (2016), "Development of EST intron-targeting SNP markers for Panax ginseng and their application to cultivar authentication", Int. J. Mol. Sci., 17(6), doi: 10.3390/ijms17060884.
[23] K. Kim, et al. (2015), "Comprehensive survey of genetic diversity in chloroplast genomes and 45S nrDNAs within Panax ginseng species", PLOS ONE, 10(6), p.e0117159.
[24] K. Kim, et al. (2017), "Evolution of the Araliaceae family inferred from complete chloroplast genomes and 45S nrDNAs of 10 Panax-related species", Sci. Rep., 7(1), doi: 10.1038/s41598-017-05218-y.
[25] V.B. Nguyen, et al. (2017), "Authentication markers for five major Panax species developed via comparative analysis of complete chloroplast genome sequences", J. Agric. Food Chem., 65(30), pp.6298-6306.
[26] V. Manzanilla, A. Kool, L. Nguyen Nhat, H. Nong Van, H. Le Thi Thu, H.J. de Boer (2018), "Phylogenomics and barcoding of Panax: Toward the identification of ginseng species", BMC Evol. Biol., 18(44), doi.org/10.1186/s12862-018-1160-y.
[27] M. Jayakodi, et al. (2018), "Ginseng Genome Database: An open-access platform for genomics of Panax ginseng", BMC Plant Biol., 18(1), doi: 10.1186/s12870-018-1282-9.
[28] Y. Zou, et al. (2017), "Nucleic acid purification from plants, animals and microbes in under 30 seconds", PLOS Biol., 15(11), p.e2003916 doi.org/10.1371/journal.pbio.2003916.
B. Babu, F.M. Ochoa-Corona, M.L. Paret (2018), "Recombinase polymerase amplification applied to plant virus detection and potential implications", Anal. Biochem., 546, pp.72-77