HCOM zu SPH Converter

HCOM-Audio online als NIST-SPH-Sprachformat kodieren

Dateien hierhin und ablegen. 1 GB maximale dateigröße oder Registrieren
in
Facebook Amazon Microsoft Tesla Nestle Walmart L'Oreal

Sprachforschungsstandard

Konvertieren Sie HCOM in SPH — das Standardformat für NIST-Sprachkorpora, Linguistikforschung und Spracherkennungs-Trainingsdaten.

Cloudbasiert

Keine NIST-Tools lokal nötig. Konvertieren Sie HCOM direkt im Browser in SPH — auf unseren Cloud-Servern.

Automatische Bereinigung

HCOM-Uploads werden nach der Verarbeitung gelöscht. SPH-Dateien werden innerhalb von 24 Stunden von den Servern bereinigt.

Wie man HCOM in SPH konvertiert

1

Wählen Sie Dateien vom Computer, Google Drive, Dropbox, einer URL oder durch Ziehen auf die Seite.

2

Wählen Sie sph oder irgendein anderes Format, das Sie als Ergebnis haben wollen (mehr als 200 Formate unterstützt)

3

Lassen Sie die Datei konvertieren und Sie können Ihre sph-Datei direkt danach herunterladen

Über die Formate

HCOM ist ein Huffman-kodiertes Audioformat aus der frühen Macintosh-Ära, das entwickelt wurde, um digitalisierten Sound für die Verteilung auf Disketten und über Bulletin-Board-Systeme zu verkleinern, als Speicherplatz kostbar und Modems langsam waren. Der Encoder nimmt vorzeichenlosen 8-Bit-PCM-Input, berechnet eine Häufigkeitstabelle der Sample-Delta-Werte und baut einen optimalen Huffman-Baum, der häufige Deltas durch kurze Bitsequenzen ersetzt. Kompressionsraten von 2:1 oder besser waren bei Sprachaufnahmen typisch — eine bedeutende Einsparung, wenn eine 3,5-Zoll-Diskette nur 800 KB fasste. Dateien wurden als Macintosh-Resource-Forks verteilt und über Dienstprogramme wie SoundApp und das BinHex-Ökosystem wiedergegeben, das den Mac-Softwareaustausch in den späten 1980er Jahren prägte. Das Format unterstützte Abtastraten bis 22,255 kHz, passend zu den Ausgabemöglichkeiten der originalen Macintosh-Soundhardware. Tools wie SoX behalten die HCOM-Dekodierungsunterstützung bei, sodass archivierte Aufnahmen auch Jahrzehnte später zugänglich bleiben. HCOM bietet drei praktische Vorteile für Archivarbeit: verlustfreie Kompression, die die Originalsamples exakt wiederherstellt, eine in jeder Datei eingebettete Huffman-Tabelle für abhängigkeitsfreie Dekodierung und historische Verbreitung in Tausenden von Vintage-Mac-Sound-Archiven.
Entwickler: Apple Computer
Erstveröffentlichung: 1985
SPH ist die Dateierweiterung für Audio im NIST SPHERE-Format (SPeech HEader REsources), einem Standard, der um 1990 vom U.S. National Institute of Standards and Technology entwickelt wurde. Für die Sprachforschung konzipiert, enthalten SPH-Dateien einen 1024-Byte-ASCII-Header mit umfangreichen Metadaten — Datenbankkennungen, Kanalzahlen, Abtastraten, Bytereihenfolge und Kompressionstyp — sodass jede Aufnahme sich selbst beschreibt. Das zugrunde liegende Audio ist typischerweise 16-Bit-lineares PCM mit 16 kHz Abtastrate, obwohl andere Konfigurationen zulässig sind. Forscher am NIST, bei der DARPA und an Universitäten weltweit setzen auf SPH für die Verteilung von Sprachkorpora wie TIMIT, Switchboard und den LDC-Sammlungen, die modernen Spracherkennungssystemen zugrunde liegen. Ein wesentlicher Vorteil ist, dass der menschenlesbare Header es Skripten ermöglicht, Aufnahme-Metadaten ohne binäre Dekodierung zu parsen. Die strikte Standardisierung eliminiert zudem Mehrdeutigkeiten beim Austausch von Datensätzen zwischen Institutionen und Plattformen. Da SPH-Dateien unkomprimiertes PCM speichern, bewahren sie die volle Audioklangtreü — entscheidend beim Training akustischer Modelle, bei denen selbst kleine Artefakte die Ergebnisse verfälschen können.
Erstveröffentlichung: 1990

Häufig gestellte Fragen

Was ist SPH?

SPH (SPHERE) ist das SPeech HEader Resources-Format von NIST für Sprachforschung. Es ist der Standard für Linguistik-Korpora weltweit.

Warum HCOM in SPH umwandeln?

Für Sprachforschungsprojekte, die Audio im NIST-SPHERE-Format benötigen. Die Konvertierung von HCOM ermöglicht Analysen mit Standard-Linguistik-Tools.

Welche Tools nutzen SPH?

HTK, Kaldi, NIST-Bewertungstools und viele Spracherkennungs-Frameworks unterstützen das SPH-Format nativ.

Ist SPH nur PCM mit Headern?

Im Wesentlichen ja. SPH umhüllt PCM-Audio mit einem textbasierten Header, der Metadaten über Aufnahmebedingungen und Inhalt enthält.

Ist die Konvertierung privat?

HCOM-Uploads werden nach der Verarbeitung gelöscht. SPH-Ergebnisse werden innerhalb von 24 Stunden von den Servern entfernt.