본문 바로가기
IT/파이썬(Python)

파이썬 (python) 한국어 음성인식, (보이스 텍스트 변환) 예제 코드 (음성 -> 텍스트 변환, speech recognition, 오프라인 음성인식)

by 생활 경제 잡화 2024. 5. 24.
반응형
SMALL

아래의 음성 인식과 오디오 패키지를 설치한다.

 

pip install SpeechRecognition

pip install pyaudio

 

설치된 패키지를 활용한 파이썬 코드는 아래와 같다

import speech_recognition as sr

r = sr.Recognizer()
	
with sr.Microphone() as source:
    r.adjust_for_ambient_noise(source, duration=0.2)
    while True:
        try:
            print('listen...')

            #listens for the user's input
            user_audio = r.listen(source)

            # Using google to recognize audio
            #text = r.recognize_google(user_audio) # 영어
            text = r.recognize_google(user_audio, language='ko-KR') # 한글

            print("Did you say: ",text)

        except sr.RequestError as e:
            print("Could not request results; {0}".format(e))

        except sr.UnknownValueError:
            print("unknown error occurred")

 

음성인식 패키지는 모두 아래와 같이 13개의 음성인식 엔진 또는 API을 지원하고 4개가 오프라인으로 동작이 가능하다.

 

Speech recognition engine/API support:

 

추가로 오프라인 음성인식중 CMU Sphinx 를 사용해보자

pip install PocketSphinx

를 추가로 설치해야됨

 

그리고 위 코드에서 인식 부분을 r.recognize_sphinx(audio) 로 수정하면 완료된다.

(참고로 한국어 인식은 지원X)

 

 

반응형
LIST