본문 바로가기

영상 화자 분리/설계

[텍스트 매칭] KMP & Gene algorithm

1. 화자 구간 추정

(1) (이상적) 영상으로 분류한 입술 이미지가 완벽한 상황

사용자 정의로 정의한 모음 그룹 분류 기준에 의해서 음성/영상으로 받아들인 입력을 각각 변환을 시도함.

이후부터는 H : 전체 모음 그룹에서 N : 특정 모음 구간 배열들을 찾아내는 KMP 알고리즘을 적요하면 무리가 없을 것.

 

(2) (현실적) 영상으로 분류한 입술 이미지는 어느 정도의 확률을 가지고 오류가 날 것,

이를 해결하기 위해서 위 (1)에서 도출한 집한 N에 대하여 돌연변이를 가한다.

그러나, 유전 알고리즘에서 돌연변이를 가하기 위해서는 특정 확률에 의한 변이, 한 마디로 확률적 기준이 필요함.

 

2. 확률적 변이

(1) 그래서 필요한 것은?

틀리는 상황을 생각해본다면, A-> B로, B->A로 판단하는 상황들임. 즉 True->False, False->True로 판별하는 상황들을 그 '확률적 기준'이라고 삼을 것임.

이를 위해서 이전에 작업한 4500여개의 이미지에 대하여 다시 학습시켜 모델을 산출해야함.

그리고 테스트 Set를 전체 학습 데이터의 10% 정도로 잡는다면 450여개의 이미지에 대하여 진행을 기획해야함.

 

(2) 나온 확률적 기준,

이 기준에 따라서 유전 알고리즘을 적용할 것이고 집한 N에 대하여 변이를 일으킬 것이고

KMP 알고리즘을 적용할 계획임