音声系AIに詳しい人教えてほしい。 (4レス)
1-

1: いつき 2023/06/25(日)20:59 ID:fGT2yVbA0(1/2) AAS
音声を100ms周期のフレームに分割してフレームごとにMFCC,パワー,自己相関関数を計算し、自己相関関数から局所最大値を得ようと思ってるんですが、以下のコードでそれはできているんでしょうか?

audio, sr = librosa.load(audio_file)
frames = librosa.util.frame(audio, frame_length=frame_length, hop_length=hop_length)

for i in ragne(frames.shape[1]):
frame = frames[:, i]
mfcc = librosa.feature.mfcc(y=frame, sr=sr, n_mfcc=25).flatten()
power = librosa.feature.rms(y=frame).flatten()
acf = np.correlate(frame, frame, mode='full')
acf = acf[acf.size//2:]
local_maxima = scipy.signal.argrelextrema(acf, np.greater)[0]
2: いつき 2023/06/25(日)21:02 ID:fGT2yVbA0(2/2) AAS
書き忘れてました、正しくはこちらのコードです。

audio, sr = librosa.load(audio_file)
frame_length = int(sr*0.1)
hop_length = frame_length
frames = librosa.util.frame(audio, frame_length=frame_length, hop_length=hop_length)

for i in ragne(frames.shape[1]):
frame = frames[:, i]
mfcc = librosa.feature.mfcc(y=frame, sr=sr, n_mfcc=25).flatten()
power = librosa.feature.rms(y=frame).flatten()
acf = np.correlate(frame, frame, mode='full')
省2
3: 2023/09/24(日)00:30 ID:mONe4BBP0(1) AAS
てす
4: 2023/09/30(土)00:37 ID:0+Z4WY+N0(1) AAS
世の中ね、顔かお金かなのよ
1-
スレ情報 赤レス抽出 画像レス抽出 歴の未読スレ AAサムネイル

ぬこの手 ぬこTOP 0.934s*