Bộ chuyển đổi CDDA sang SPH
Chuyển âm thanh CD sang định dạng giọng nói NIST SPH trực tuyến
Tiêu chuẩn nghiên cứu
Tạo tệp NIST Sphere từ CDDA — định dạng được yêu cầu bởi các kho dữ liệu nghiên cứu giọng nói lớn như TIMIT và Switchboard.
Xử lý trên máy chủ
Chuyển đổi SPH chạy trên máy chủ của chúng tôi. Không cần cài công cụ NIST hay Kaldi — chuyển CDDA sang SPH từ bất kỳ trình duyệt nào.
Xử lý an toàn
Tệp CDDA tải lên được xóa sau khi chuyển đổi. Tệp SPH đầu ra tự động bị xóa khỏi máy chủ trong vòng 24 giờ.
Làm thế nào để chuyển đổi CDDA sang SPH
Lựa chọn các tập tin từ Máy tính, Google Drive, Dropbox, URL hoặc bằng cách kéo tập tin vào trang này.
Chọn sph hoặc bất kỳ định dạng nào khác bạn cần chuyển đổi sang (hỗ trợ hơn 200 định dạng)
Hãy để tập tin chuyển đổi và bạn có thể tải tập tin sph của bạn xuống ngay sau đó
Về các định dạng
Các câu hỏi thường gặp
SPH (NIST Sphere) là định dạng chuẩn để phân phối kho dữ liệu nghiên cứu giọng nói. Chuyển CDDA sang SPH giúp bản ghi có thể dùng trong học thuật.
Sphere là định dạng do NIST định nghĩa để trao đổi dữ liệu giọng nói trong nghiên cứu. Nó bao gồm header văn bản chứa siêu dữ liệu và dữ liệu âm thanh PCM.
Bộ công cụ NIST SPH, SoX, Kaldi và HTK đọc được định dạng Sphere. Hầu hết framework nghiên cứu nhận dạng giọng nói đều hỗ trợ.
SPH có thể lưu âm thanh ở nhiều tần số. Nghiên cứu giọng nói thường dùng 8-16 kHz, nhưng định dạng xử lý được dữ liệu CDDA 44.1 kHz.
Tải nhiều tệp CDDA lên và chuyển sang SPH trong một phiên — tiện lợi cho xây dựng tập dữ liệu nghiên cứu giọng nói từ bản ghi CD.