Quote Originally Posted by XCNY View Post
прикольно, ну не думаю что это просто...
но вариант кормить звуком гугловскую нейросеть , которая обрабатыват изображения - что она там такого обработает.... - это в самом деле работающий вариант. ( просто просится в Tensor Flow ). Другое дело - а как потом данные интерпретировать. Допустим , что распознавать голос ( хотя при ресамплинге тембр голоса меняется и ещё что-то ). У нас кое-кому одно время хотелось музыкальное исполнение распознавать и отличать фальшивое исполнение от настоящего. Обычно подход совсем другой - звук преобразуют в миди файл из аудио.