Ses konuşma tanımlayıcı yazılımlar

Vikipedi, özgür ansiklopedi
Subvokal konuşma tanıma araştırmalarında kullanılan elektrotlar.

Sesli konuşmayı yazıya çeviren bilgisayar yazılımları veya daha yaygın ve bilinen ingilizce adıyla "Speech recognition"

kelime açılımı kök anlamıyla ses kayıt tespiti ; Dikte - [Türkçe Konuşma Tanıma]

genelde bilinen Konuşma Sentezleyici veya Speech Synthesizer, programlarının aksine mikrofon benzeri bir şekilde daha önceden alınan bir konuşma veya diyalogun bilgisayar üzerinde yazılı bir hale getirilmesi için kullanılan programlardır.

kullanım alanları[değiştir | kaynağı değiştir]

özellikle gazetecilik açısında video ve ses formatında alınan görüşme ve mülakatların bilgisayar ortamında arşivlenmesi ve daha sonraki süreçlerde kişilerin hangi sözü ne zaman söylediğini ortaya çıkması açısında kullanıldığı gibi ulusal güvenlik açısında yasal zaman aşımı süresince kaydedilen telefon görüşmelerinin şüpheli konuşma veya anahtar kelimeli arama için dinleme işinin yasal anlamda tarafsız olarak bilgisayar tarafından tanımlanmasıdır.

çeşitli tartışmalar[değiştir | kaynağı değiştir]

genelde bu tarz programlar her ülkenin kendi istikbarat teşkilatı içinde geliştirildip kullanıldığı yönünde söylentiler söylene gelmektedir !

Free software[değiştir | kaynağı değiştir]

Free speech corpus and acoustic model repositories[değiştir | kaynağı değiştir]

Proprietary software[değiştir | kaynağı değiştir]

  • AT&T WATSON
  • HTK — copyrighted by Microsoft, but altering the software for the Licensee's internal use is allowed.
  • CSLU Toolkit
  • Dragon NaturallySpeaking from Nuance Communications is the continuous-speech successor to the older DragonDictate product, and appears to be the focus of all their current development effort (in the dictation area). Since version 10.1 it runs on 64-bit Windows, too.
  • IBM ViaVoice - Control and development as it pertains to embedded processors remain in the hands of IBM. Linux, Mac OS, and Windows products were licensed to Nuance Communications (formerly ScanSoft) which has since discontinued the product. The Nuance website provides a list of which legacy systems can run the final versions.
  • MacSpeech Dictate - Mac OS X speech recognition using the Dragon NaturallySpeaking engine. This replaces MacSpeech's former iListen product which is based on Philips Speech Technology.
  • Microsoft Windows Speech Recognition - Windows Vista and Windows 7 includes version 8.0 of the Microsoft speech recognition engine along with a completely new end user speech experience, known as Windows Speech Recognition.
  • Microsoft Speech API - Speech recognition functionality included as part of Microsoft Office and on Tablet PCs running Microsoft Windows XP Tablet PC Edition. It may also be downloaded as part of the Speech SDK 5.1 for Windows applications, but since that is aimed at developers building speech applications, the pure SDK form lacks any user interface, and thus is unsuitable for end users.
  • Philips SpeechMagic - Market leader within the medical industry according to Frost & Sullivan, Philips SpeechMagic is a recognition engine that may be run either as a stand-alone product or integrated into other applications.[1][2]
  • Proteus Conversational Interface
  • Simmortel Voice
  • Quack.com (acquired by AOL)
  • SpeechWorks
  • Tellme Networks (acquired by Microsoft)

Kaynakça[değiştir | kaynağı değiştir]

Konu hakkında basında yer alan haberler[değiştir | kaynağı değiştir]