별도의 원어민 성우 섭외나 추가 녹음 없이 여러 언어 구사 가능해 코난테크놀로지가 AI 성우 ‘코난보이스’에 최신 음성기술을 적용해 음성 AI 기술력을 한 단계 높였다. 코난보이스는 22일 사용자의 목소리를 다양한 언어로 변환하는 새로운 음성합성 모델을 공개했다. 발음기호를 언어마다 다르게 사용하는 대신 국제음성기호(IPA) 기반의 공통 발음기호를 사용해 한 사람의 목소리로 여러 언어의 음성 합성이 가능한 모델이다. 성우 고유의 억양과 음성 특성은 유지한 채 여러 외국어를 원어민에 가까운 수준으로 충실하게 합성해주며, 별도의 원어민 성우 섭외나 추가 녹음 없이도 여러 언어를 구사하는 것이 장점이다. 기존의 텍스트 기반 음성합성에서 진일보한 시도인 동시에, 다국어 음성합성에 대한 고객의 꾸준한 니즈를 반영했다. 현재 한국어 및 영어를 제공하며 추후 일본어, 중국어 등으로 늘려갈 계획이다. 최신 음성모델의 알고리즘은 기존 대비 크기가 콤팩트해졌으며 효율적으로 음성을 생성해 화자의 표현력을 손실 없이 구현하게 됐다. 플로우 기반의 최신 기법을 적용해 트랜스포머 신경망 모델 대비 연속성이 보강된 원활한 입출력 흐름으로 자연스러운 음성을 생성하게 됐다. 서비스도 업데
[첨단 헬로티] "보이스 솔루션은 물류현장에서 생산성, 정확성, 용이성, 안정성, 가시성, 유연성의 효과를 고객에게 전달할 수 있는 혁신적인 솔루션이다" 한국하니웰이 오는 28일 '보이스를 활용한 물류경쟁력 강화' 웨비나를 통해 이같은 특장점을 갖고 있는 보콜렉트 음성기반 솔루션을 소개한다. 한국하니웰에 따르면, 물류현장의 피킹시 에러발생의 요인은 상품누락, 다른 상품 피킹, 수량 오류가 대부분인데, 이러한 문제를 보콜렉트의 음성기반 솔루션으로 해결할 수 있다. 보콜렉트의 음성 기술은 데이터 시스템 통합을 위한 헤드셋을 포함한 통합 토탈 솔루션으로, 까다로운 산업환경에 최적화된 음성인식 기술 플랫폼을 제공한다. 창고 관리자는 중앙 관리 콘솔로부터 예정보다 앞서 있는 작업자를 확인하고 필요한 경우, 창고의 다른 영역으로 이동해 작업을 함으로써 효율성을 더할 수 있다. 근로자는 작업을 하는데 있어 종이나 스크린을 읽기 위해 멈출 필요가 없어 생산성 향상에 기여할 수 있으며, 음성기술의 직관적인 특성으로 근로자는 자율적으로 일할 수 있다. 특히, 현재 물류현장에서 사용되고 있는 DPS 및 DAS, PDA 보다 보콜렉트의 음성기반 솔루션이 갖는 장점이 크다는 분석