OpenAI 의 ASR 모델 (Whisper) 기반으로 영상내 음성을 추출하여 이를 한글자막으로 생성하는 STT 서비스를 LIVE stream 에 확장한 것으로 25.6 개발시점기준 한글데이타 번역정확도는 85%수준임.
LIVE STT(실시간 자막) 적용 방법
스트림서버 송출 설정
•
서버 : rtmp://1.230.162.120:41935/live/
•
스트림 키 : {streamKey}
•
비트레이트 : 1000 Kbps
•
방송시작
<<예시) OBS 인코더/sw>>
웹플레이어 접근
•
최대 동시 4개채널(medium) 가능
•
medium 모델로 작동시 메모리 약 5GB 사용 / RTX4090은 24GB로 최대 4개 가능




