Ingat cerita horor dari hari-hari pengenalan suara Windows XP? Itu berantakan, bagaimanapun, dengan munculnya AI dan pembelajaran mesin, ucapan-ke-teks (bukan teks pidato) transkripsi menjadi lebih andal dan efisien dari sebelumnya. Ada banyak aplikasi pidato ke teks yang melakukan itu secara real-time tetapi bagaimana jika Anda ingin mentranskripsikan rekaman suara menjadi teks? Saya telah membuat daftar solusi terbaik untuk mengonversi rekaman suara menjadi teks di ponsel, browser web, dan PC Anda. Mari kita periksa.
Untuk menguji keakuratan perangkat lunak berikut, kami akan menggunakan perekaman satu menit pertama dari video YouTube ini.
Ubah Rekaman Suara Anda menjadi Teks
1. Transkripsikan
Transkripsikan mentranskripsikan rekaman video dan audio ke dalam teks. Meskipun aplikasinya gratis, ia memonetisasi waktu transkripsi setiap jam. Dibandingkan dengan opsi kelas atas dalam daftar ini seperti Happyscribe, tarif cukup masuk akal hanya $ 4,99. Pengembang tidak menentukan apakah mereka menggunakan API ucapan-ke-teks seperti Google Cloud Input atau solusi khusus.
Baca baca: Perangkat lunak TTS terbaik untuk Mac
Aplikasi ini memberikan hasil yang jelas dengan tanda baca yang hilang di sana-sini. Itu hanya bermasalah dengan kata-kata yang tidak jelas atau sedikit menyimpang. Apa pun itu, aplikasi masih mengeluarkan kata yang paling dekat dan menilai transkripsi itu sendiri. Namun demikian, hasilnya luar biasa, langkah yang jelas dari solusi gratis seperti Bear Converter, dan dengan transkripsi $ 4,99 per jam, itu tidak akan merusak bank.
Akurasi: 96%
Instal Transkripsikan (iOS)
2. Otter.AI
Otter adalah aplikasi transkripsi yang bagus untuk siswa dan membantu mereka meringankan tugas membosankan menyalin catatan. Tidak hanya Siswa, ini juga populer di kalangan profesional yang menggunakannya untuk menyalin notulen rapat dan konferensi. Meskipun ditujukan untuk menyalin dengan cepat, Anda masih dapat mengunggah rekaman suara dari penyimpanan lokal dan mentranskripsikan file audio. Semua transkripsi terjadi di cloud dan Anda mendapatkan dua varian skrip. Draf pertama adalah transkripsi cepat yang dibuat dalam hitungan detik dan mungkin berisi kesalahan, namun audio diproses lagi di cloud dan secara signifikan meningkatkan akurasi transkrip. Aplikasi ini gratis dan tersedia untuk Android dan iOS, Anda dapat menyalin hingga 600 menit.
Terkait: Aplikasi OCR Terbaik untuk iPhone
Selama pengujian, saya menemukan aplikasinya masih sangat akurat dan mendapatkan semua kata dengan benar, masih bermasalah dengan tanda baca. Itu juga tidak dapat mengidentifikasi perubahan paragraf apa pun, tetapi itu bukan masalah besar karena saya dapat mengedit skrip setelahnya.
Akurasi: 94%
Instal Otter (Android | iOS)
3. Happyscribe
Happyscribe adalah opsi online pertama di daftar ini. Ini adalah penawaran berbayar yang ditargetkan langsung pada para profesional, termasuk jurnalis — dan harganya pasti menunjukkan ini: Happyscribe's pay as you go plan berharga 12 Euro per jam. Untuk uang sebanyak itu, pasti ada imbalan yang berarti. Ini hadir dalam bentuk algoritme pembelajaran mesin yang sangat canggih dari Happyscribe — yang digunakan untuk mengidentifikasi dan mentranskripsikan ucapan. Algoritme Happyscribe cukup canggih untuk mengenali beberapa berbeda speaker — ini membuat proses second-pass lebih cepat dengan menawarkan mode peta panas yang menunjukkan dengan tepat di bagian mana dalam transkrip algoritmanya bermasalah. Anda juga mendapatkan berbagai opsi ekspor file, dari dokumen Word dan file teks biasa hingga SRT yang diberi stempel waktu.
Baca baca: Aplikasi Terbaik untuk Senior yang tinggal sendiri
Itu menunjukkan hasil yang luar biasa dan mendapatkan hampir semua kata dengan benar, bahkan mendeteksi perubahan paragraf yang bagus jika Anda memiliki banyak pembicara dalam percakapan. Happyscribe memiliki uji coba gratis yang memberi Anda akses ke transkripsi selama 30 menit. Secara keseluruhan, jika Anda mencari solusi audio-ke-teks online terbaik di kelasnya, Happyscribe adalah pilihan yang bagus.
Akurasi: 99%
Lihat Happyscribe
4. Sonix
Sonix sangat mirip dengan Happyscribe dan ditujukan untuk jenis target pasar yang sama — pengguna bisnis yang menginginkan solusi transkripsi berbasis AI yang andal yang benar-benar menyelesaikan pekerjaan, meskipun dengan biaya transkripsi manusia yang lebih rendah. Harga Sonix mencerminkan hal ini: Anda mencari langganan $ 11,25 per bulan untuk lisensi pengguna tunggal di atas tarif $ 6,00 per jam untuk rekaman. Jika Anda ingin menangani volume besar, ini membuatnya lebih kompetitif daripada Happyscribe tetapi yang terakhir menang untuk kasus penggunaan volume yang lebih kecil. Sonix juga memiliki uji coba gratis selama 30 menit, meskipun Anda harus memasukkan informasi kartu kredit / debit Anda untuk mengaksesnya. Kami mencobanya dan sangat terkejut dengan kualitas transkripsinya.
Baca baca: Ini adalah perangkat lunak Transkripsi terbaik untuk Mac
Sama seperti Hyperscribe, Sonix menunjukkan hasil yang sangat bagus. Tidak ada satu kata pun yang salah ditranskripsikan. Hal lain yang perlu diperhatikan adalah bahwa Sonix membutuhkan lebih sedikit waktu untuk menyelesaikan transkrip daripada Happyscribe.
Akurasi: 97%
Lihat Sonix
5. Bear File Converter
Perangkat lunak transkripsi profesional bisa jadi mahal! Meskipun Anda melewatkan transkripsi terbaik di industri, alternatif gratis lebih disukai jika anggaran Anda nol. Kami mencoba konverter Bear sebagai opsi gratis. Ini adalah konverter multimedia yang memungkinkan Anda untuk mengubah hampir semua jenis file menjadi yang lain dan secara kebetulan memiliki MP3 ke TXT konverter yang menggunakan mesin pengenalan suara Baidu.
Meskipun pengenalan Baidu tidak sempurna, pengenalan tersebut mentranskripsikan sekitar 70 persen pidato dengan benar. Lumayan untuk konverter media yang bahkan tidak diiklankan sebagai perangkat lunak transkripsi! Ada batas 3MB pada file audio untuk transkripsi. Anda dapat menurunkan ukuran file dengan melakukan encoding ulang ke bitrate yang lebih rendah, tetapi itu hanya dapat memperburuk pengenalan.
Akurasi: 70%
Lihat Bear File Converter
6. Sobolsoft MP3 to Text Converter
Sobolsoft memiliki lebih dari 1500 aplikasi dan transkripsi audio hanyalah salah satunya. Konverter Sobolsoft Speech to Text memerlukan sedikit lebih banyak pengaturan daripada kebanyakan. Anda memerlukan kunci API IBM Speech to Text untuk membuatnya berfungsi. Pidato Watson ke teks memberi Anda 100 menit transkripsi gratis per bulan setelah itu diberi harga dengan tarif per menit. Sobolsoft sendiri memiliki versi gratis dan versi berbayar $ 19,99. Selain layar cerewet, saya tidak melihat perbedaan yang signifikan saat menggunakan versi gratis.
Hasil tes terlihat jelas saat Anda menampilkan Watson dari IBM. Namun, hasilnya tidak lebih baik dari beberapa aplikasi yang lebih canggih di atas seperti Happyscribe dan Otter. Itu tidak mengenali tanda baca atau perubahan paragraf.
Akurasi: 93%
Lihat Sobol Mp3 to Text Converter
Kata Penutup
Ini adalah pilihan saya untuk aplikasi terbaik untuk mengonversi rekaman suara menjadi teks. Otter dan Transcribe adalah solusi terbaik untuk pengguna ponsel. Sonix lebih murah daripada Hyperscribe jika Anda ingin menyalin lebih banyak. Sobolsoft MP3 to Text agak ketinggalan jaman tetapi masih segar dan kuat di tulang. Aplikasi apa yang paling Anda sukai dari daftar ini atau jika Anda memiliki solusi yang lebih baik, beri tahu saya di komentar di bawah?
Baca baca: Aplikasi Teleprompter Terbaik untuk Android