Chuyển đổi WVE sang HTK

Chuyển âm thanh WVE của Psion sang định dạng nghiên cứu HTK

Thả tập tin ở đây. 1 GB Kích thước file tối đa hoặc là Đăng ký
đến
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Phục hồi âm thanh PDA

Trích xuất âm thanh từ tệp WVE Psion cổ điển và chuyển sang HTK — làm cho bản ghi PDA có thể truy cập trong định dạng được hỗ trợ.

Không cần PsiWin

Chuyển đổi WVE mà không cần PsiWin hay SoX. Toàn bộ quá trình chạy trên trình duyệt web của bạn.

Xử lý bảo mật

Tệp WVE tải lên được xóa ngay sau khi chuyển đổi. Tệp đầu ra bị xóa khỏi máy chủ trong vòng 24 giờ.

Làm thế nào để chuyển đổi WVE sang HTK

1

Lựa chọn các tập tin từ Máy tính, Google Drive, Dropbox, URL hoặc bằng cách kéo tập tin vào trang này.

2

Chọn htk hoặc bất kỳ định dạng nào khác bạn cần chuyển đổi sang (hỗ trợ hơn 200 định dạng)

3

Hãy để tập tin chuyển đổi và bạn có thể tải tập tin htk của bạn xuống ngay sau đó

Về các định dạng

WVE là định dạng âm thanh gốc của dòng thiết bị hỗ trợ cá nhân kỹ thuật số Psion Series 3, được công ty Psion PLC của Anh phát hành từ tháng 9 năm 1991. Các PDA dạng vỏ sò này tích hợp máy ghi âm, và mọi chức năng đọc chính tả đều dựa vào tệp WVE để lưu âm thanh thu được. Mỗi tệp bắt đầu bằng chữ ký ASCII "ALawSoundFile**" theo sau bởi header tối giản, rồi âm thanh mã hóa A-law thô lấy mẫu ở 8 kHz — tần số thừa hưởng từ tiêu chuẩn viễn thông kỹ thuật số. Ở 8000 byte mỗi giây, một phút ghi âm chỉ chiếm 480 KB, điều thiết yếu khi thiết bị Psion lưu trữ dữ liệu trên thẻ SRAM thường có dung lượng 128 KB đến 2 MB. Mã hóa A-law mang lại độ rõ giọng nói hợp lý trong điều kiện lưu trữ eo hẹp, ưu tiên dễ nghe hơn là tái tạo trung thực chất lượng cao. Tệp WVE có thể chuyển đổi sang WAV hoặc các định dạng hiện đại bằng SoX, Awave Studio hoặc các tiện ích chuyên dụng cho Psion. Dù là sản phẩm của thời kỳ điện toán cầm tay đầu thập niên 1990, định dạng này có ý nghĩa lịch sử như một trong những định dạng ghi âm đầu tiên được thiết kế cho thiết bị tiêu dùng bỏ túi. Các nhà sưu tập và nhà nghiên cứu lịch sử điện toán di động đôi khi gặp tệp WVE khi khôi phục dữ liệu từ phương tiện SRAM cũ.
Nhà phát triển: Psion PLC
Phát hành lần đầu: 1991
HTK là container dạng sóng gốc cho Hidden Markov Model Toolkit, bộ phần mềm được phát triển tại Khoa Kỹ thuật Đại học Cambridge phục vụ nghiên cứu nhận dạng giọng nói. Phân phối lần đầu vào năm 1993, HTK nhanh chóng trở thành nền tảng tham chiếu trong các phòng thí nghiệm ngôn ngữ học tính toán trên toàn thế giới, và định dạng tệp của nó cũng lan rộng theo. Mỗi tệp lưu một chuỗi vector tham số hoặc mẫu thô kèm tiêu đề 12 byte chỉ định số khung, chu kỳ khung tính bằng đơn vị 100 ns, số byte mỗi khung, và mã loại chỉ ra kiểu dữ liệu — các tùy chọn dao động từ PCM dạng sóng đến hệ số cepstral tần số Mel và năng lượng bộ lọc. Tính đa dụng này cho phép một container duy nhất chứa cả âm thanh nguồn lẫn đặc trưng đã trích xuất mà không cần thay đổi bộ phân tích. Tiêu đề cố ý tối giản không có padding căn chỉnh hay khối tùy chọn, khiến định dạng cực kỳ dễ đọc từ C, Python hoặc MATLAB chỉ với vài dòng I/O nhị phân. Ba ưu điểm làm nên sự bền vững của HTK: tích hợp chặt chẽ với pipeline huấn luyện và nhận dạng HTK, bố trí byte xác định loại bỏ mơ hồ trong phân tích, và được áp dụng rộng rãi trong các kho dữ liệu học thuật.
Phát hành lần đầu: 1993

Các câu hỏi thường gặp

Tại sao chuyển WVE sang HTK?

HTK dùng cho nghiên cứu nhận dạng giọng nói. Chuyển dữ liệu giọng WVE đưa vào pipeline huấn luyện ML.

Có thể mở tệp HTK bằng gì?

Bộ công cụ HTK và SoX đọc được các tệp nghiên cứu HTK.

Định dạng WVE là gì?

WVE là định dạng âm thanh gốc của thiết bị PDA Psion (Series 3, 5, Revo). Nó lưu trữ âm thanh mã hóa A-law 8-bit — di sản từ hệ điều hành EPOC.

Hệ thống hiện đại có phát được WVE không?

SoX và PsiWin trên Windows có thể xử lý WVE. Các trình phát thông thường không hỗ trợ — chuyển đổi là cách dễ nhất để nghe lại.

Có thể chuyển nhiều tệp WVE cùng lúc không?

Có. Tải lên nhiều bản ghi Psion và chuyển đổi hàng loạt — tiện lợi khi lưu trữ cả thư viện âm thanh PDA.