Thứ Bảy, 8 tháng 2, 2014

Phát hiện marker microsotellite từ cơ sở dữ liệu trình tự est của cây xoài


v
SUMMARY

HIEN NGUYEN MINH, Nong Lam University, Ho Chi Minh City. August, 2006.
“DEVELOPMENT OF MICROSATELLITE MARKER FROM EST (Expressed
Sequence Tags) SEQUENCE DATABASE OF MANGO TREE (Mangifera indica)”.

Supervisor:
Dr. TRI BUI MINH

The research was carried out at the Chemical and Biological Analysis and
Experiment Center at Nong Lam University.

Nowadays the development of science and technology together with the
combination of different research field have created great advantages for research.
Bioinformatics – a new field that support speed up information processing will be an
useful tool to deal with problems in biology research.
Mango tree is an important tropical fruit tree in Vietnam, it has high economic
value. Therefore the identification of mango genus, the analysis of genetic diversity,
gene mapping are the current goal. Because of useful marker, our objective is to
develop an in-silico method in order to identify microsatellite marker from EST
database.
Methodology: we used Perl scripts such as est_trimmer.pl, misa.pl, BioEdit
software with CAP contig assembly program, Primer3 software and the package tool –
ssrfinder_1_0.
Result:
Download EST sequences from NCBI database
Identify 267 microsatllite include dinucleotide (4.12%), trinucleotide
(95.51%) and tetranucleotide (0.37%)
Identify consensus region and design primer for 6 sorts: CAA, CCA,
CAT, TCA, TCT, TGA.


vi
MỤC LỤC

CHƢƠNG TRANG
Trang tựa
Lời cảm tạ iii
Tóm tắt iv
Summary v
Mục lục vi
Danh sách các chữ viết tắt x
Danh sách các bảng xi
Danh sách các hình xii

1. MỞ ĐẦU 1
1.1. Đặt vấn đề 1
1.2. Mục đích và yêu cầu 1
1.2.1. Mục đích 1
1.2.2. Yêu cầu 2
1.3. Giới hạn 2
2. TỔNG QUAN TÀI LIỆU 3
2.1. Giới thiệu về tin sinh học 3
2.1.1. Định nghĩa 3
2.1.2. Mối quan hệ giữa sinh học và tin học 3
2.1.3. Tầm quan trọng của tin sinh học 4
2.1.4. Mục tiêu của tin sinh học 5
2.1.5. Vai trò của tin sinh học 5
2.1.6. Một số bài toán lớn trong tin sinh học 6
2.2. Khái quát về dữ liệu trình tự 7
2.2.1. Lịch sử 7
2.2.2. Một số cơ sở dữ liệu trên thế giới 8
2.2.2.1. NCBI 8
2.2.2.2. EBI 8

vii
2.2.2.3. DDBJ và PDBj 9
2.3. Ngôn ngữ lập trình Perl 9
2.3.1. Giới thiệu về Perl và lịch sử phát triển 9
2.3.2. Ứng dụng 10
2.3.3. Perl và tin sinh học 10
2.3.4. Các thành phần cơ bản trong Perl 11
2.3.4.1. Dữ liệu vô hƣớng 11
2.3.4.2. Các cấu trúc điều khiển 13
2.3.4.3. Mảng 14
2.3.4.4. Bảng băm 17
2.3.4.5. Thao tác với tập tin 17
2.3.4.6. Chƣơng trình con 19
2.3.4.7. Regular expression 21
2.4. Giới thiệu về cây xoài 21
2.4.1. Vị trí phân loại 21
2.4.2. Nguồn gốc 22
2.4.3. Giá trị dinh dƣỡng và lợi ích 22
2.4.4. Đặc điểm hình thái 23
2.4.4.1. Rễ 23
2.4.4.2. Thân và tán cây 23
2.4.4.3. Lá 23
2.4.4.4. Hoa 23
2.4.4.5. Quả 24
2.4.4.6. Hạt 24
2.4.4.7. Phôi 25
2.4.5. Yêu cầu sinh thái 25
2.4.5.1. Nhiệt độ 25
2.4.5.2. Đất 25
2.4.5.3. Lƣợng mƣa 26
2.4.6. Một số giống xoài trồng phổ biến ở Việt Nam 26
2.4.6.1. Xoài cát Hòa Lộc 26
2.4.6.2. Xoài cát Cần Thơ 26

viii
2.4.6.3. Xoài thơm 26
2.4.6.4. Xoài bƣởi 26
2.4.6.5. Xoài tƣợng 27
2.4.6.6. Xoài Thanh Ca 27
2.5. Khái quát về EST 27
2.5.1. Định nghĩa 27
2.5.2. Nguyên nhân hình thành và ứng dụng của EST 27
2.5.3. Sự hình thành EST 29
2.6. Giới thiệu về microsatellite 30
2.6.1. Khái niệm 30
2.6.2. Đặc điểm 30
2.6.3. Cơ chế hình thành microsatellite 31
2.6.3.1. Sự trƣợt lỗi của polymerase 31
2.6.3.2. Sự bắt cặp không đồng đều trong giảm phân 32
2.6.4. Mô hình sự đột biến của microsatellite 32
2.6.4.1. Mô hình đột biến bậc thang 32
2.6.4.2. Mô hình “K” alen 33
2.6.4.3. Mô hình alen vô hạn 34
2.6.5. Nguyên nhân tồn tại của microsatellite 34
2.6.6. Các cách phân lập microsatellite 35
2.6.6.1. Microsatellite có nguồn gốc từ thƣ viện 35
2.6.6.2. Microsatellite từ thƣ viện BAC/YAC 35
2.6.6.3. Microsatellite từ thƣ viện cDNA 36
2.6.6.4. Microsatellite có nguồn gốc từ dữ liệu 36
2.6.6.5. Kiểm tra microsatellite từ một loài có liên quan 38
2.6.7. Ƣu điểm và hạn chế 38
2.6.7.1. Ƣu điểm 38
2.6.7.2. Hạn chế 39
3. PHƢƠNG TIỆN VÀ PHƢƠNG PHÁP TIẾN HÀNH 40
3.1. Thời gian và địa điểm 40
3.2. Phƣơng tiện 40
3.3. Phƣơng pháp 40

ix
3.3.1. Thu nhận trình tự EST của cây xoài 41
3.3.1.1. NCBI và EST 41
3.3.1.2. Truy cập cơ sở dữ liệu và thu nhận trình tự 41
3.3.2. Sắp xếp các trình tự EST 42
3.3.3. Tìm kiếm microsatellite 44
3.3.3.1. Công cụ SSRIT 44
3.3.3.2. Công cụ MISA 45
3.3.4. Xác định vùng bảo tồn 46
3.3.5. Thiết kế primer 47
3.3.5.1. Primer3 49
3.3.5.2. Chƣơng trình Perl ssrfinder_1_0 50
4. KẾT QUẢ VÀ THẢO LUẬN 53
4.1. Thu nhận trình tự EST của cây xoài 53
4.2. Sắp xếp các trình tự 54
4.3. Kết quả tìm kiếm microsatellite 54
4.3.1. Công cụ SSRIT 54
4.3.2. Công cụ MISA 55
4.4. Xác định vùng bảo tồn 58
4.5. Thiết kế primer đối với 6 microsatellite 59
4.5.1. Chƣơng trình Primer3 59
4.5.2. Chƣơng trình Perl script ssrfinder_1_0 60
5. KẾT LUẬN VÀ ĐỀ NGHỊ 62
5.1. Kết luận 62
5.2. Đề nghị 63
6. TÀI LIỆU THAM KHẢO 64
7. PHỤ LỤC 66


x
DANH SÁCH CÁC CHỮ VIẾT TẮT

 AFLP Amplified Fragment Length Polymorphism
 BAC Bacterial Aritificial Chromosome
 bp base pair
 cDNA complementary DNA
 CIB Center Information Biology
 DDBJ DNA Data Bank Japan
 DNA Deoxyribonucleic acid
 EBI European Bioinformatics Institute
 EMBL European Molecular Biology Laboratory
 EST Expressed Sequence Tag
 IAM Infinite Alleles Model
 kb kilo base
 Mb mega base
 MISA Microsatellite identification tool
 NIG National Institute of Genetics
 NIH National Institute of Health
 NCBI National Center for Biotechnology Information
 PCR Polymerase Chain Reaction
 PDBj Protein Database Japan
 PIR Protein Information Resource
 RAPD Random Amplified Polymorphic DNA
 SMM Stepwise Mutation Model
 SSR Simple Sequence Repeat
 SSRIT Simple Sequence Repeat Identification Tool
 UTR unstranlated region
 YAC Yeast Artificial Chromosome

xi
DANH SÁCH CÁC BẢNG

BẢNG TRANG
Bảng 2.1. Giá trị dinh dƣỡng của quả xoài 22
Bảng 4.1. Kết quả tìm kiếm microsatellite 56
Bảng 4.2. Sự phân bố các dạng lặp lại của microsatellite 56
Bảng 4.3. Các loại SSR 57
Bảng 4.4. Các loại microsatellite nghiên cứu 58
Bảng 4.5. Kết quả thiết kế primer từ chƣơng trình Primer3 59


xii
DANH SÁCH CÁC HÌNH

HÌNH TRANG
Hình 2.1. Sử dụng máy tính để xử lý các thông tin sinh học 4
Hình 2.2. Dữ liệu trình tự theo cách cũ 8
Hình 2.3. Hoa xoài 24
Hình 2.4. Quả xoài 24
Hình 2.5. Sơ đồ hình thành EST 27
Hình 2.6. Sự hình thành EST 29
Hình 2.7. Sự bặt cặp không đồng đều trong giảm phân 32
Hình 2.8. Mô hình đột biến bậc thang 33
Hình 3.1. Sơ đồ chung các bƣớc tiến hành 40
Hình 3.2. Trang entrez của NCBI 41
Hình 3.3. Trang tìm kiếm trình tự 42
Hình 3.4. Tải toàn bộ trình tự 42
Hình 3.5. Chạy chƣơng trình est_trimmer.pl 44
Hình 3.6. Công cụ SSRIT 44
Hình 3.7. Kết quả tìm SSR của SSRIT 45
Hình 3.8. File misa.ini 46
Hình 3.9. Sắp gióng cột trình tự 47
Hình 3.10.Chƣơng trình Primer3 50
Hình 4.1. Trình tự EST ở định dạng FASTA 53
Hình 4.2. Tiến trình thực thi của est_trimmer.pl 54
Hình 4.3. Nội dung file mango.fasta.misa 55
Hình 4.4. Các file trình tự sau khi phân nhóm 57
Hình 4.5. Xác định vùng bảo tồn của microsatellite CAA 58
Hình 4.6. Kết quả thiết kế primer của microsatellite TCA 59
Hình 4.7. Nội dung file primer_result20060715.txt 60
Hình 4.8. Kết quả thiết kế primer 61
Hình 5.1. Sơ đồ phƣơng pháp thực hiện 62
1

Phần 1
MỞ ĐẦU

1.1. Đặt vấn đề
Hiện nay với sự phát triển của khoa học kỹ thuật cùng với sự kết hợp liên thông
giữa các ngành khoa học đã mở ra những thuận lợi to lớn cho việc nghiên cứu và phát
triển. Tin sinh học – một ngành khoa học mới ra đời với mục đích hỗ trợ, cung cấp
thông tin dữ liệu sẽ là một công cụ hữu ích giúp giải quyết những vấn đề khó khăn
trong nghiên cứu sinh học trên thực tế.
Xoài là cây ăn quả nhiệt đới quan trọng ở nƣớc ta chúng đƣợc trồng phổ biến ở
nhiều vùng miền trong cả nƣớc. Cây xoài vừa có giá trị dinh dƣỡng vừa có giá trị kinh
tế cao, từ quả xoài, rễ xoài,… đến lá xoài đều là nguồn thu lợi ích cho ngƣời trồng.
Chính vì thế việc xác định các giống xoài, phân tích sự đa dạng di truyền, lập bản đồ
các gen trong bộ gen là mục tiêu hiện nay
Hiện này microsatellite là một marker rất hữu dụng trong việc lập bản đồ phân
tử, xác định các giống cây trồng, đánh giá nguồn gốc tổ tiên của cây trồng cho mục
đích nghiên cứu quần thể cây trồng và nghiên cứu quá trình tiến hóa. Nguyên nhân là
do microsatellite có những ƣu điểm vƣợt trội so với những marker khác nhƣ biểu hiện
số lƣợng lớn sự đa hình, là marker đồng trội nên có thể phân biệt đƣợc dị hợp tử. Một
thuận lợi to lớn nữa của marker microsatellite là có thể phát triển in silico (trên máy
tính) dựa vào các phần mềm tin sinh học. Vì vậy có thể giảm chi phí và thời gian cho
việc phát hiện microsatellite so với cách thực hiện bằng thực nghiệm.
Dựa trên những cơ sở đó, chúng tôi thực hiện đề tài “Phát hiện marker
microsatellite từ cơ sở dữ liệu trình tự EST (Expressed Sequence Tags) của cây
xoài (Mangifera indica).”

1.2. Mục đích và yêu cầu
1.2.1. Mục đích
Xây dựng phƣơng pháp phát hiện microsatellite đối với cây xoài từ
nguồn cơ sở dữ liệu EST hiện có, cho phép tạo ra công cụ phân tích, nhận diện,
so sánh các giống xoài.
2


1.2.2. Yêu cầu
Tìm kiếm và tải đƣợc hầu hết các trình tự EST của cây xoài hiện có trên
các cơ sở dữ liệu.
Phát hiện các kiểu SSR phổ biến từ EST có đƣợc.
Thiết kế các primer phù hợp cho phép phát hiện ra các SSR kể trên bằng
công cụ PCR.

1.3. Giới hạn
Cơ sở dữ liệu trình tự sinh học giới hạn ở NCBI.
Quy trình thực hiện chỉ tiến hành trên đối tƣợng là cây xoài.

Không có nhận xét nào:

Đăng nhận xét