아래의 음성 인식과 오디오 패키지를 설치한다.
pip install SpeechRecognition
pip install pyaudio
설치된 패키지를 활용한 파이썬 코드는 아래와 같다
import speech_recognition as sr
r = sr.Recognizer()
with sr.Microphone() as source:
r.adjust_for_ambient_noise(source, duration=0.2)
while True:
#listens for the user's input
user_audio = r.listen(source)
# Using google to recognize audio
#text = r.recognize_google(user_audio) # 영어
text = r.recognize_google(user_audio, language='ko-KR') # 한글
print("Did you say: ",text)
except sr.RequestError as e:
print("Could not request results; {0}".format(e))
except sr.UnknownValueError:
print("unknown error occurred")
음성인식 패키지는 모두 아래와 같이 13개의 음성인식 엔진 또는 API을 지원하고 4개가 오프라인으로 동작이 가능하다.
Speech recognition engine/API support:
- CMU Sphinx (works offline)
- Google Speech Recognition
- Google Cloud Speech API
- Wit.ai
- Microsoft Azure Speech
- Microsoft Bing Voice Recognition (Deprecated)
- Houndify API
- IBM Speech to Text
- Snowboy Hotword Detection (works offline)
- Tensorflow
- Vosk API (works offline)
- OpenAI whisper (works offline)
- Whisper API
추가로 오프라인 음성인식중 CMU Sphinx 를 사용해보자
pip install PocketSphinx
를 추가로 설치해야됨
그리고 위 코드에서 인식 부분을 r.recognize_sphinx(audio) 로 수정하면 완료된다.
(참고로 한국어 인식은 지원X)
