Chuyển đổi CVSD sang NIST

Chuyển từ CVSD sang NIST với công cụ trên trình duyệt

Thả tập tin ở đây. 1 GB Kích thước file tối đa hoặc là Đăng ký
đến
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Định dạng hiện đại

Bản ghi CVSD dễ dùng hơn ở dạng NIST. Chuyển đổi mở khóa định dạng dùng rộng rãi trong nghiên cứu giọng nói.

Chuyển đổi dễ dàng

Quy trình thiết kế đơn giản. Kéo âm thanh vào, chọn định dạng và lấy kết quả.

Chuyển đổi an toàn

Mọi tệp xử lý an toàn — đầu vào CVSD bị xóa, kết quả NIST hết hạn trong 24 giờ.

Làm thế nào để chuyển đổi CVSD sang NIST

1

Lựa chọn các tập tin từ Máy tính, Google Drive, Dropbox, URL hoặc bằng cách kéo tập tin vào trang này.

2

Chọn nist hoặc bất kỳ định dạng nào khác bạn cần chuyển đổi sang (hỗ trợ hơn 200 định dạng)

3

Hãy để tập tin chuyển đổi và bạn có thể tải tập tin nist của bạn xuống ngay sau đó

Về các định dạng

CVSD (Continuously Variable Slope Delta modulation) là phương pháp số hóa giọng nói được chuẩn hóa cho sử dụng quân sự và viễn thông bởi NATO và CCITT trong những năm 1970. Nó mã hóa sự khác biệt giữa các mẫu liên tiếp thành một bit duy nhất — 1 nếu mẫu hiện tại vượt quá dự đoán, 0 nếu ngược lại — trong khi bộ lọc nén âm tiết điều chỉnh kích thước bước bằng cách theo dõi chuỗi các bit giống nhau. Hoạt động ở 16 đến 64 kbps, CVSD cân bằng giữa độ rõ giọng nói và băng thông, trở thành lựa chọn mã hóa cho các liên kết quân sự bảo mật và hệ thống vô tuyến chiến thuật. Luồng bit có thể được giải mã bằng phần cứng đơn giản, ban đầu được tích hợp trong các mạch tích hợp chuyên dụng. Một ưu điểm là sự đơn giản khi triển khai — bộ mã hóa và giải mã chỉ cần tài nguyên tối thiểu, cho phép xử lý thời gian thực trên phần cứng nhúng công suất thấp. Khả năng chống chịu trong điều kiện nhiễu là thế mạnh khác, vì lỗi bit đơn lẻ chỉ ảnh hưởng đến các mẫu cục bộ thay vì làm hỏng toàn bộ khung. SoX cung cấp hỗ trợ mã hóa và giải mã bằng phần mềm, cho phép các hệ thống hiện đại làm việc với các bản ghi CVSD cũ từ kho lưu trữ quân sự và hạ tầng viễn thông cổ điển.
Nhà phát triển: CCITT / NATO
Phát hành lần đầu: 1970
NIST SPHERE (SPeech HEader REsources) là định dạng tệp âm thanh chuyên dụng do Viện Tiêu chuẩn và Công nghệ Quốc gia Hoa Kỳ phát triển, phục vụ nghiên cứu giọng nói, đặc biệt các dự án được DARPA tài trợ. Định dạng này đóng gói các mẫu âm thanh thô kèm theo phần header ASCII có cấu trúc, chứa siêu dữ liệu như tần số lấy mẫu, số kênh, kiểu mã hóa, thông tin nhân khẩu học người nói và chú thích phiên âm — lý tưởng cho việc phân phối kho dữ liệu giọng nói. Các tệp NIST thường lưu trữ âm thanh PCM không nén hoặc mu-law ở tần số lấy mẫu chất lượng điện thoại (8 kHz hoặc 16 kHz), dù bộ chứa đủ linh hoạt để hỗ trợ nhiều kiểu mã hóa khác. Ưu điểm nổi bật là phần header tự mô tả phong phú, cho phép nhà nghiên cứu nhúng trực tiếp siêu dữ liệu chi tiết của kho ngữ liệu vào tệp mà không cần tệp đi kèm. SPHERE cũng trở thành tiêu chuẩn thực tế cho các cơ sở dữ liệu giọng nói lớn như TIMIT, Switchboard và Fisher corpus, được công nhận rộng rãi trong các phòng thí nghiệm học thuật và chính phủ. Đặc tả mở và sự sẵn có của các công cụ dòng lệnh (sphere, h_strip, w_decode) giúp việc chuyển đổi, kiểm tra và xử lý các tệp này trở nên đơn giản trong các quy trình xử lý giọng nói.
Phát hành lần đầu: 1990

Các câu hỏi thường gặp

Tại sao chuyển CVSD sang NIST?

CVSD không phát được ngoài phần mềm viễn thông. NIST mang lại định dạng header chuẩn hóa.

Làm sao mở âm thanh NIST?

Bạn có thể mở NIST bằng bộ công cụ HTK, SoX và phần mềm nghiên cứu giọng nói.

Có mất chất lượng không?

Không. NIST lưu âm thanh không nén thêm, bản ghi CVSD được giữ nguyên.

Có trên mọi thiết bị không?

Có — công cụ chạy trong trình duyệt trên mọi hệ điều hành.

Có thể chuyển nhiều bản ghi cùng lúc không?

Có — tải nhiều bản ghi và chuyển song song.

Có tốn phí không?

Chuyển đổi tiêu chuẩn không tốn phí. Gói trả phí mở khóa giới hạn cao hơn.