1. 화자 구간 추정
(1) (이상적) 영상으로 분류한 입술 이미지가 완벽한 상황
사용자 정의로 정의한 모음 그룹 분류 기준에 의해서 음성/영상으로 받아들인 입력을 각각 변환을 시도함.
이후부터는 H : 전체 모음 그룹에서 N : 특정 모음 구간 배열들을 찾아내는 KMP 알고리즘을 적요하면 무리가 없을 것.
(2) (현실적) 영상으로 분류한 입술 이미지는 어느 정도의 확률을 가지고 오류가 날 것,
이를 해결하기 위해서 위 (1)에서 도출한 집한 N에 대하여 돌연변이를 가한다.
그러나, 유전 알고리즘에서 돌연변이를 가하기 위해서는 특정 확률에 의한 변이, 한 마디로 확률적 기준이 필요함.
2. 확률적 변이
(1) 그래서 필요한 것은?
틀리는 상황을 생각해본다면, A-> B로, B->A로 판단하는 상황들임. 즉 True->False, False->True로 판별하는 상황들을 그 '확률적 기준'이라고 삼을 것임.
이를 위해서 이전에 작업한 4500여개의 이미지에 대하여 다시 학습시켜 모델을 산출해야함.
그리고 테스트 Set를 전체 학습 데이터의 10% 정도로 잡는다면 450여개의 이미지에 대하여 진행을 기획해야함.
(2) 나온 확률적 기준,
이 기준에 따라서 유전 알고리즘을 적용할 것이고 집한 N에 대하여 변이를 일으킬 것이고
KMP 알고리즘을 적용할 계획임
'영상 화자 분리 > 설계' 카테고리의 다른 글
[개발예정] 입술 분류 계획 (0) | 2020.04.23 |
---|---|
[visionVoice] 유전 알고리즘(1) 전체 설계 (0) | 2019.11.13 |