아래의 음성 인식과 오디오 패키지를 설치한다.
pip install SpeechRecognition
pip install pyaudio
설치된 패키지를 활용한 파이썬 코드는 아래와 같다
import speech_recognition as sr
r = sr.Recognizer()
with sr.Microphone() as source:
r.adjust_for_ambient_noise(source, duration=0.2)
while True:
try:
print('listen...')
#listens for the user's input
user_audio = r.listen(source)
# Using google to recognize audio
#text = r.recognize_google(user_audio) # 영어
text = r.recognize_google(user_audio, language='ko-KR') # 한글
print("Did you say: ",text)
except sr.RequestError as e:
print("Could not request results; {0}".format(e))
except sr.UnknownValueError:
print("unknown error occurred")
음성인식 패키지는 모두 아래와 같이 13개의 음성인식 엔진 또는 API을 지원하고 4개가 오프라인으로 동작이 가능하다.
Speech recognition engine/API support:
- CMU Sphinx (works offline)
- Google Speech Recognition
- Google Cloud Speech API
- Wit.ai
- Microsoft Azure Speech
- Microsoft Bing Voice Recognition (Deprecated)
- Houndify API
- IBM Speech to Text
- Snowboy Hotword Detection (works offline)
- Tensorflow
- Vosk API (works offline)
- OpenAI whisper (works offline)
- Whisper API
추가로 오프라인 음성인식중 CMU Sphinx 를 사용해보자
pip install PocketSphinx
를 추가로 설치해야됨
그리고 위 코드에서 인식 부분을 r.recognize_sphinx(audio) 로 수정하면 완료된다.
(참고로 한국어 인식은 지원X)
'IT > 파이썬(Python)' 카테고리의 다른 글
파이썬 turtle 터틀 모듈 라이브러리 이벤트, 이동, 그리기, 상태, 모양, 화면, 윈도우, 함수 리스트 및 기능 설명 정리 (1) | 2024.10.18 |
---|---|
파이썬 pygame 배경 사운드 이펙트 사운드 재생 예제 코드 (mixer, music, load, play) (0) | 2024.05.29 |
파이썬 대용량 파일 읽기 (메모리 매핑, 파일 디스크립터, 식별자, mmap, fileno) (0) | 2024.05.23 |
파이썬 프로세스 스레드 쓰레드 차이 예제 코드 treading multiprocessing GIL, 바이트코드 , I/O바운드 CPU 바운드 (0) | 2024.05.22 |
파이썬 스레드 (쓰레드, thread, threading) 병렬처리, 멀티스레드 예제 코드 (0) | 2024.05.22 |