일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- LLM
- Linux
- KAKAO
- Database
- Flask
- git
- Python
- Paper
- Package
- Container
- evaluation
- file
- DB
- numpy
- enV
- judge
- TORCH
- Windows
- CUDA
- pandas
- pytorch
- PostgreSQL
- Converting
- Laravel
- Mac
- docker
- format
- AI
- list
- GitLab
Archives
- Today
- Total
목록MFCC (1)
Daily Develope
[Python] MFCC 구현
ㅇ Process 1. 파일 불러오기 2. 전처리 (증폭) 3. Framing (프레임화) 4. Windowing (프레임 적용) 5. Fourier Transform (FT) 6. Mel-Filter 적용 7. Discrete Cosine Transform (DST) 8. MFCC 9. 출력 1. 파일 불러오기 ㅇ 음성파일을 byte 코드로 읽어서 사용 - 아래 예는 8000 sample_rate, 16bit 음성 데이터 사용 - 즉 signal의 index는 시간(1/진동수), value는 magnitude를 의미 f=open(target, 'rb') buf = bytearray(f.read()) pcm_data = numpy.frombuffer(buf, dtype = 'int16') signal =..
Develope/Python
2022. 4. 4. 13:45