Bộ chuyển đổi GSM sang NIST

Mã hóa âm thanh điện thoại GSM thành định dạng nghiên cứu giọng nói NIST

Thả tập tin ở đây. 1 GB Kích thước file tối đa hoặc là Đăng ký
đến
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Định dạng chuẩn nghiên cứu

Chuẩn bị bản ghi âm thoại GSM cho nghiên cứu giọng nói bằng cách chuyển sang định dạng NIST được yêu cầu bởi các công cụ phân tích học thuật.

Không cần cài đặt

Bỏ qua việc thiết lập bộ công cụ SPHERE trên máy. Chuyển đổi GSM sang NIST hoàn toàn trực tuyến qua trình duyệt web.

Xử lý riêng tư

Tệp GSM tải lên được xóa sau khi chuyển đổi. Tệp NIST được tự động dọn dẹp khỏi máy chủ trong vòng 24 giờ.

Làm thế nào để chuyển đổi GSM sang NIST

1

Lựa chọn các tập tin từ Máy tính, Google Drive, Dropbox, URL hoặc bằng cách kéo tập tin vào trang này.

2

Chọn nist hoặc bất kỳ định dạng nào khác bạn cần chuyển đổi sang (hỗ trợ hơn 200 định dạng)

3

Hãy để tập tin chuyển đổi và bạn có thể tải tập tin nist của bạn xuống ngay sau đó

Về các định dạng

GSM 06.10 (Full Rate) là codec giọng nói nền tảng của tiêu chuẩn Hệ thống thông tin di động toàn cầu, được ETSI phê chuẩn năm 1991 và triển khai trên hàng trăm mạng di động toàn thế giới. Hoạt động ở tốc độ cố định 13 kbit/s, thuật toán áp dụng Kích thích xung đều với Dự đoán dài hạn (RPE-LTP) để nén các khung giọng nói 20 ms ở 8 kHz mono thành chỉ 33 byte mỗi khung. Cách tiếp cận này mô hình hóa thanh quản như bộ lọc dự đoán tuyến tính, mã hóa tín hiệu kích thích và tận dụng tính tuần hoàn cao độ để giảm thêm — được tinh chỉnh để mang lại giọng nói rõ ràng trong giới hạn băng thông của các kênh di động số đời đầu. Codec không chỉ dùng cho điện thoại GSM mà còn nhiều ứng dụng VoIP, hệ thống thư thoại và nền tảng IVR hưởng lợi từ bitrate thấp. Ba ưu điểm nổi bật. Thứ nhất, nén phi thường: một phút giọng nói chỉ chiếm khoảng 100 KB, cho phép lưu trữ và truyền tải hiệu quả. Thứ hai, công cụ phổ biến — các thư viện như libgsm và SoX xử lý mã hóa và giải mã trên mọi nền tảng chính. Thứ ba, bối cảnh bằng sáng chế miễn phí bản quyền đã khuyến khích áp dụng trong các dự án viễn thông mã nguồn mở như Asterisk và FreeSWITCH.
Phát hành lần đầu: 1991
NIST SPHERE (SPeech HEader REsources) là định dạng tệp âm thanh chuyên dụng do Viện Tiêu chuẩn và Công nghệ Quốc gia Hoa Kỳ phát triển, phục vụ nghiên cứu giọng nói, đặc biệt các dự án được DARPA tài trợ. Định dạng này đóng gói các mẫu âm thanh thô kèm theo phần header ASCII có cấu trúc, chứa siêu dữ liệu như tần số lấy mẫu, số kênh, kiểu mã hóa, thông tin nhân khẩu học người nói và chú thích phiên âm — lý tưởng cho việc phân phối kho dữ liệu giọng nói. Các tệp NIST thường lưu trữ âm thanh PCM không nén hoặc mu-law ở tần số lấy mẫu chất lượng điện thoại (8 kHz hoặc 16 kHz), dù bộ chứa đủ linh hoạt để hỗ trợ nhiều kiểu mã hóa khác. Ưu điểm nổi bật là phần header tự mô tả phong phú, cho phép nhà nghiên cứu nhúng trực tiếp siêu dữ liệu chi tiết của kho ngữ liệu vào tệp mà không cần tệp đi kèm. SPHERE cũng trở thành tiêu chuẩn thực tế cho các cơ sở dữ liệu giọng nói lớn như TIMIT, Switchboard và Fisher corpus, được công nhận rộng rãi trong các phòng thí nghiệm học thuật và chính phủ. Đặc tả mở và sự sẵn có của các công cụ dòng lệnh (sphere, h_strip, w_decode) giúp việc chuyển đổi, kiểm tra và xử lý các tệp này trở nên đơn giản trong các quy trình xử lý giọng nói.
Phát hành lần đầu: 1990

Các câu hỏi thường gặp

Định dạng NIST là gì?

NIST là định dạng dữ liệu giọng nói từ Viện Tiêu chuẩn và Công nghệ Quốc gia, được sử dụng rộng rãi trong nghiên cứu và đánh giá giọng nói.

Tại sao chuyển GSM sang NIST?

Định dạng NIST được yêu cầu bởi nhiều bộ đánh giá nhận dạng giọng nói, kho dữ liệu nghiên cứu và công cụ học thuật xử lý dữ liệu thoại điện thoại.

NIST khác SPH như thế nào?

NIST và SPH đều thuộc họ định dạng SPHERE. Chúng về cơ bản là cùng một tiêu chuẩn dùng cho nghiên cứu giọng nói.

Công cụ nghiên cứu nào đọc được NIST?

Kaldi, HTK, Praat và bộ công cụ NIST SPHERE chính thức đều hỗ trợ tệp định dạng NIST để phân tích giọng nói.

Quá trình chuyển đổi có bảo mật không?

Tệp GSM tải lên được xóa ngay sau khi chuyển đổi. Kết quả NIST được xóa khỏi máy chủ trong vòng 24 giờ.