gnuh109 Admin
Tổng số bài gửi : 124 Join date : 26/09/2015 Age : 34 Đến từ : Bố Trạch, Quảng Bình
| Tiêu đề: LUẬN VĂN Tìm hiểu và xử lý tiếng nói trong MATLAB ( Thuyết minh + Mô phỏng ) Fri Oct 16, 2015 9:38 pm | |
| LUẬN VĂN Tìm hiểu và xử lý tiếng nói trong MATLAB ( Thuyết minh + Mô phỏng )
Ngôn điệu chính là cái mang lại cho tiếng nói con người những âm sắc riêng biệt. Ngôn điệu của lời nói liên kết chặt chẽ với ngữ điệu. Ngữđiệu là sự nâng cao hạ thấp của giọng nói trong câu. Tiếng Việt ta là một ngôn ngữ khá phức tạp bao gồm cả ngôn điệu và ngữ điệu. Do đó vấn đề nghiên cứu các phương pháp nhận dạng tiếng nói đã và đang thu hút rất nhiều sự đầu tưvà nghiên cứu của nhà khoa học.Tuy nhiên cho đến nay kết quả mang lạivẫn chưa hoàn thiện do tính chất quá phức tạp và không cố định củađối tượng nhận dạng là tiếng nói con người, đặc biệt là tiếng Việt. Hiện nay có rất nhiều phương pháp nhận dạng tiếng nói. Mô hình Fujisaki được ứng dụng rộng rãi trong hệ thống của tiếng Nhật, mô hình MFGI (Mixdorff Fujisaki model of German Intonation) được ứng dụng trong tiếng Đức, mô hình HMM (hidden markov models)… Trong các mô hình ấy lại áp dụng nhiều phương pháp nhận dạng khác nhau.Mọi phương pháp mang một tính đặc trưng và ưu điểm riêng. • Phương pháp LPC (linear predictive coding)-mã hóa dự báo tuyến tính: nhược điểm là có một số từ phát âm gần giống nhauthì bị nhầm lẫn nhiều. • Phương pháp AMDF (average magnitudedifference function)- hàm hiệu biên độ trung bình:ưu điểm là số ngõ vào ít,kích thước mạng huấn luyện nhỏ, ít phụ thuộc vào cách phát âm nên tỉ lệ đọc sai ít hơn phương pháp LPC, tuy nhiên khuyết điểm là không phân biệt về thanh điệu, khó sử ụng trong trường hợp từ đọc liên tiếp. • AMDF & LPC :Do ưu và nhược điểmcủa hai phương pháp LPC và AMDF nên cần sự kết hợp giữa hai phương pháp đó. IV http://ww.ebook.edu.vn • Phương pháp thứ tư MFCC (mel-frequency ceptrums coefficients). Nhận dạng tiếng nói là một quá trình nhận dạng mẫu, với mục đích là phân lớp thông tin đầu vào là tín hiệu tiếng nói thành một dãy tuần tự các mẫu đã được học trước đó và lưu trữ trong bộ nhớ. Các mẫu là các đơn vị nhận dạng, chúng có thể là các từ hay là các âm vị. Nếu các mẫu nàylà bất biến và không thay đổi thì công việc nhận dạng tiếng nóitrở nên đơn giản bằng cách so sánh dữ liệu tiếng nói cần nhận dạng với các mẫu đã được học và lưu trữ trong bộ nhớ. Nhận dạng tiếng nói là một lĩnh vực tuy không mới nhưng vô cùng phức tạp. Nhận dạng tiếng nói được thế giới bắt đầu nghiên cứu cách đây hơn 50 năm, tuy nhiên những kết quả thực tế đạt được vô cùng khiêm tốn.Còn phải rất lâu nữa con người mới đạt đến việc xây dựng một hệ thống hiểu được tiếng nói như con người. Trong phạm vi chỉ là một đồ án môn học,phần này em sẽ xây dựng chương trình nhận dạng mười chữ số tiếng Việt bằng những công cụ có sẵn của Matlab. Định hướng xây dựng chương trình nhận dạng được tất cả cáctừ, câu trong tiếng việt để có thể ứng dụng được vào thực tế. Tuy nhiên do chỉ mới tiếp xúc ở lĩnh vực này nên khả năng, kiến thức của em còn rất hạn chế, cộng vào đó là những khó khăn về thời gian, phương tiện…nên em chỉ có thể xây dựng một hệ thống nhận dạng nhỏ. Trong tương lai nếu có điều kiện tiếp xúc và nghiên cứusâu hơn về lĩnh vực này, em mong muốn phát triển đồ án này lênđể có thể ứng dụng trong thực tế. V http://ww.ebook.edu.vn MỤC LỤC CHƯƠNG 1: LÝ THUYẾT ÂM THANH VÀ TIẾNG NÓI:……….……...…..Error! Bookmark not defined. 1.1 Nguồn gốc âm thanh: ....................................... Error! Bookmark not defined. 1.2 Các đại lượng đặctrưng cho âm thanh: ............ Error! Bookmark not defined. 1.4 Cơ chế tạo lập tiếng nói của con người: .......... Error! Bookmark not defined. 1.5 Mô hình lọc nguồn tạo tiếng nói: ..................... Error! Bookmark not defined. 1.6 Hệ thống nghecủa người: ................................ Error! Bookmark not defined. 1.7 Quá trình sản xuất tiếng nói và thu nhận tiếng nói của con người: ......... Error! Bookmark not defined. 1.8.1 Nguyên âm: ................................................ Error! Bookmark not defined. 1.8.2 Các âm vị khác: ......................................... Error! Bookmark not defined. CHƯƠNG 2: LÝ THUYẾT NHẬN DẠNG TIẾNG NÓI:…………………….Error! Bookmark not defined. 2.1 Tổng quan về nhận dạng tiếng nói .................. Error! Bookmark not defined. 2.2 Các nguyên tắc cơ bản trong nhận dạng tiếng nói ......... Error! Bookmark not defined. 2.4.1 Phân tích các đặc trưng (tham số) tiếng nói ............. Error! Bookmark not defined. 2.4.3 Xử lý ngôn ngữ: ......................................... Error! Bookmark not defined. 2.5 Các tiếp cận nhận dạng tiếng nói .................... Error! Bookmark not defined. VI http://ww.ebook.edu.vn 2.5.1 Tiếp cận âm thanh-ngữ âm ........................ Error! Bookmark not defined. 2.5.2 Tiếp cận nhận dạng mẫu ........................... Error! Bookmark not defined. 2.5.3 Tiếp cận trí tuệ nhân tạo:.......................... Error! Bookmark not defined. 2.6 Các phương pháp nhận dạng tiếng nói ............ Error! Bookmark not defined. 2.6.1 Mô hình Fujisaki: ....................................... Error! Bookmark not defined. 2.6.2 Mô hình Markvo ẩn ................................... Error! Bookmark not defined. 2.6.3 Mô hình mạng neuron: ............................... Error! Bookmark not defined. CHƯƠNG 3 : TÍN HIỆU THỜI GIAN LIÊN TỤC:……………...…….…..Error! Bookmark not defined. 3.1 Quá trình lấy mẫu tín hiệu :………………………………………………………Error! Bookmark not defined. 3.2 Các sơ đồ lấy mẫu : .......................................... Error! Bookmark not defined. 3.3 Lấy mẫu một tínhiệu hình sin : ....................... Error! Bookmark not defined. 3.4.1 Hiện tượng chống phổ trong lĩnh vực thời gian : ...... Error! Bookmark not defined. 3.4.2 Hiện tượng chồng phổ trong lĩnh vựctần số: ............ Error! Bookmark not defined. 3.5 Chuyển đổi A/D và D/A : ................................. Error! Bookmark not defined. 3.5.2 Bộ chuyển đổi A/D sigma-delta lấy mẫu quá : ........ Error! Bookmark not defined. 3.5.3 Điều chế sigma-delta đa bit: ...................... Error! Bookmark not defined. 3.6 Chuyển đổi D/A lấy mẫu quá : ........................ Error! Bookmark not defined. 3.7 thiết kế các mạch lọc số IIR: ........................... Error! Bookmark not defined. VII http://ww.ebook.edu.vn 3.7.1 Tổng quan các kỹ thuật thiết kế mạch lọc số: .......... Error! Bookmark not defined. 3.7.2 Một số qui định đối với mạch lọc tương tự : ............. Error! Bookmark not defined. 3.8 Thiết kế mạch lọc số bằng sự bất biến xung: .. Error! Bookmark not defined. 3.9 Thiết kế mạch lọc số từ mạch lọc Butterworth thông thấp: . Error! Bookmark not defined. 3.9.1 Các đặc trưng của mạch lọcButterworth thông thấp tương tự: ..... Error! Bookmark not defined. 3.9.2 Thiết kế mạch lọc tương tự Butterworth thông thấp: Error! Bookmark not defined. CHƯƠNG 4: MẠNG NEURON:.……………………………………………...Error! Bookmark not defined. 4.1 Định nghĩa mạng neuron: ................................. Error! Bookmark not defined. 4.2 Kiến trúc mạng neuron: ................................... Error! Bookmark not defined. 4.2.1 Perceptron mộthay nhiều lớp: .................. Error! Bookmark not defined. 4.3 Đặc trưng củamạng neuron: ............................ Error! Bookmark not defined. 4.3.1 Tính chất phi tuyến: ................................... Error! Bookmark not defined. 4.3.2 Tính chất tương ứng đầu vào – đầu ra: ...... Error! Bookmark not defined. 4.3.3 Tính chất thích nghi: .................................. Error! Bookmark not defined. 4.3.4 Tính chất đưa ra lờigiải có bằng chứng: ... Error! Bookmark not defined. 4.3.5 Tính chất chấp nhận sai sót: ...................... Error! Bookmark not defined. VIII http://ww.ebook.edu.vn 4.3.6 Tính chất đồng dạng trong phân tích và thiết kế: ..... Error! Bookmark not defined. CHƯƠNG 5: GIỚI THIỆU HÀM VÀ TOOBOX TRONG MATLAB CẦN ĐỂ XÂY DỰNG HỆ THỐNG NHẬN DẠNG TIẾNG NÓI BẰNG MẠNG NEURON:...…………………………………………………………………………..Error! Bookmark not defined. VoiceBox toolbox ................................................... Error! Bookmark not defined. NetLab toolbox ....................................................... Error! Bookmark not defined. CHƯƠNG 6: XÂY DỰNG CHƯƠNG TRÌNH MÔ PHỎNG NHẬN DẠNG TIẾNG NÓI BẰNG MẠNG NEURON MLP:……………………………………………………………….…………………Error! Bookmark not defined. 6.1 Các bước xây dựng .......................................... Error! Bookmark not defined. 6.2 Chương trình nhận dạng phát âm mười chữ số tiếng Việt:……………………Error! Bookmark not defined. KẾT LUẬN:…………...…………………………………………………………..…Error! Bookmark not defined. PHỤ LỤC:…………...…………………………………………………………...…..Error! Bookmark not defined. TÀI LIỆU THAM KHẢO:.........................................................................................74
LINK DOWNLOAD
[You must be registered and logged in to see this link.] | |
|