본문 바로가기

영상 화자 분리/설계

[개발예정] 입술 분류 계획 보호되어 있는 글입니다.

[텍스트 매칭] KMP & Gene algorithm 1. 화자 구간 추정 (1) (이상적) 영상으로 분류한 입술 이미지가 완벽한 상황 사용자 정의로 정의한 모음 그룹 분류 기준에 의해서 음성/영상으로 받아들인 입력을 각각 변환을 시도함. 이후부터는 H : 전체 모음 그룹에서 N : 특정 모음 구간 배열들을 찾아내는 KMP 알고리즘을 적요하면 무리가 없을 것. (2) (현실적) 영상으로 분류한 입술 이미지는 어느 정도의 확률을 가지고 오류가 날 것, 이를 해결하기 위해서 위 (1)에서 도출한 집한 N에 대하여 돌연변이를 가한다. 그러나, 유전 알고리즘에서 돌연변이를 가하기 위해서는 특정 확률에 의한 변이, 한 마디로 확률적 기준이 필요함. 2. 확률적 변이 (1) 그래서 필요한 것은? 틀리는 상황을 생각해본다면, A-> B로, B->A로 판단하는 상황들임...

[visionVoice] 유전 알고리즘(1) 전체 설계 1. Github : https://github.com/snrndi121/visionVoice snrndi121/visionVoice [우수상] Future Finance AI Challenge (seperate voice from vision) - snrndi121/visionVoice github.com 2. 설계도 2.1 초기 세대 생성 탐색 베이스(src) G0의 각 요소 문자의 인덱스 리스트 생성, markingMemory markingMemory와 탐색 대상(dst) Gx를 기반으로 G0에서 유사 패턴, talkTree 2.2 룰렛휠 talkTree를 기반으로 일정 수식에 따라서 각 패턴에 대하여 점수화 상위 Top N개(현재는 4개)로 정렬 후, 진화 알고리즘 적용 2.3 자식세대 생성 세대..

이전 1 다음

티스토리툴바