Add AudioTransform: convert samples

Clement Champetier · Clement Champetier · commit 36de2c64d497 · 2014-06-04T18:26:12.000+02:00
* AudioTransform: does the same process as ColorTransform, but applied
to audio.
* AudioDesc: add a function to get a FrameDesc.
* AudioRewrapper: use AudioTransform.
diff --git a/app/SConscript b/app/SConscript
@@ -69,6 +69,7 @@ audioRewrapper = env.Program(
                 'avformat',
                 'avcodec',
                 'swscale',
+                'swresample',
                 ]
         )
 
diff --git a/app/audioRewrapper/audioRewrapper.cpp b/app/audioRewrapper/audioRewrapper.cpp
@@ -2,11 +2,15 @@
 #include <iomanip>
 
 #include <AvTranscoder/InputFile.hpp>
+#include <AvTranscoder/OutputFile.hpp>
+
 #include <AvTranscoder/AvInputStream.hpp>
 #include <AvTranscoder/InputStreamAudio.hpp>
 #include <AvTranscoder/OutputStreamAudio.hpp>
 
-#include <AvTranscoder/OutputFile.hpp>
+#include <AvTranscoder/AudioTransform.hpp>
+
+
 
 void rewrapAudio( const char* inputfilename, const char* outputFilename )
 {
@@ -52,56 +56,65 @@ void transcodeAudio( const char* inputfilename, const char* outputFilename )
 	InputFile inputFile( inputfilename );
 	inputFile.analyse();
 
+	OutputFile outputFile( outputFilename );
+	outputFile.setup();
+	
 	// init audio decoders
 	InputStreamAudio inputStreamAudio( inputFile.getStream( 0 ) );
 	inputFile.getStream( 0 ).setBufferred( true );
-	
-	OutputFile outputFile( outputFilename );
-	outputFile.setup();
-	outputFile.addAudioStream( inputFile.getStream( 0 ).getAudioDesc() );
-	outputFile.beginWrap();
 
+	// init audio encoders
 	OutputStreamAudio outputStreamAudio;
 	AudioDesc& audioDesc = outputStreamAudio.getAudioDesc();
-	audioDesc.setAudioCodec( "pcm_s16le" );
+	audioDesc.setAudioCodec( "pcm_s24le" );
 	audioDesc.setAudioParameters( 
 		inputFile.getStream( 0 ).getAudioDesc().getSampleRate(),
 		inputFile.getStream( 0 ).getAudioDesc().getChannels(),
-		inputFile.getStream( 0 ).getAudioDesc().getSampleFormat()
+		AV_SAMPLE_FMT_S32//,inputFile.getStream( 0 ).getAudioDesc().getSampleFormat()
 		);
 	
-	DataStream codedFrame;
-	
 	if( ! outputStreamAudio.setup( ) )
 	{
 		std::cout << "error during initialising audio output stream" << std::endl;
 		exit( -1 );
 	}
 	
-	// Transcoding
-	std::cout << "start transcoding" << std::endl;
+	outputFile.addAudioStream( audioDesc );
+	outputFile.beginWrap();
+	
+	// init convert
+	AudioTransform audioTransform;
+	
+	DataStream codedFrame;
 
+	// start transcoding process
+	std::cout << "start transcoding" << std::endl;
+	
+	AudioFrame audioFrameSource( inputFile.getStream( 0 ).getAudioDesc().getFrameDesc() );
+	AudioFrame audioFrameToEncode( audioDesc.getFrameDesc() );
+	
 	size_t frame = 0;
-	AudioFrameDesc audioFrameDesc;
-
-	AudioFrame audioFrame( audioFrameDesc );
-
-	while( inputStreamAudio.readNextFrame( audioFrame ) )
+	while( inputStreamAudio.readNextFrame( audioFrameSource ) )
 	{
-		std::cout << "\rprocess frame " << (int)frame - 1 << std::endl << std::flush;
+		std::cout << "\rprocess frame " << (int)frame - 1 << std::flush;
 
-		// convert
-		
-		outputStreamAudio.encodeFrame( audioFrame, codedFrame );
+		audioTransform.convert( audioFrameSource, audioFrameToEncode );
 		
+		outputStreamAudio.encodeFrame( audioFrameToEncode, codedFrame );
+				
 		outputFile.wrap( codedFrame, 0 );
 
 		++frame;
+//		if(frame == 10*48100)
+//			break;
 	}
 	std::cout << std::endl;
 	
 	outputStreamAudio.encodeFrame( codedFrame );
-
+	outputFile.wrap( codedFrame, 0 );
+	
+	// end of transcoding process
+	
 	outputFile.endWrap();
 }
 
diff --git a/src/AvTranscoder/AudioTransform.cpp b/src/AvTranscoder/AudioTransform.cpp
@@ -0,0 +1,74 @@
+#include "AudioTransform.hpp"
+#include "DatasStructures/AudioFrame.hpp"
+#include "common.hpp"
+
+extern "C" {
+#ifndef __STDC_CONSTANT_MACROS
+	#define __STDC_CONSTANT_MACROS
+#endif
+#include <libavcodec/avcodec.h>
+#include <libavutil/opt.h>
+#include <libswresample/swresample.h>
+#if LIBAVCODEC_VERSION_MAJOR > 54
+	#include <libavutil/frame.h>
+#endif
+}
+
+#include <stdexcept>
+
+namespace avtranscoder
+{
+
+AudioTransform::AudioTransform()
+	: m_audioConvertContext( NULL )
+	, m_isInit    ( false )
+{
+}
+
+bool AudioTransform::init( const AudioFrame& src, const AudioFrame& dst )
+{
+	m_audioConvertContext = swr_alloc();
+	
+	if( !m_audioConvertContext )
+	{
+		throw std::runtime_error( "unable to create audio convert context" );
+	}
+	
+	av_opt_set_int(m_audioConvertContext, "in_channel_layout", av_get_default_channel_layout( src.desc().getChannels() ), 0);
+	av_opt_set_int(m_audioConvertContext, "out_channel_layout", av_get_default_channel_layout( dst.desc().getChannels() ), 0);
+	
+	av_opt_set_int(m_audioConvertContext, "in_sample_rate", src.desc().getSampleRate(), 0);
+	av_opt_set_int(m_audioConvertContext, "out_sample_rate", dst.desc().getSampleRate(), 0);
+	
+	av_opt_set_int(m_audioConvertContext, "in_sample_fmt", src.desc().getSampleFormat(), 0);
+	av_opt_set_int(m_audioConvertContext, "out_sample_fmt", dst.desc().getSampleFormat(), 0);
+	
+	if( swr_init( m_audioConvertContext ) < 0 )
+	{
+		swr_free( &m_audioConvertContext );
+		throw std::runtime_error( "unable to open audio convert context" );
+	}
+	
+	return true;
+}
+
+void AudioTransform::convert( const AudioFrame& src, AudioFrame& dst )
+{
+	if( ! m_isInit )
+	{
+		m_isInit = init( src, dst );
+		m_isInit = true;
+	}
+		
+	if( dst.getSize() != src.getSize() )
+		dst.getBuffer().resize( src.getSize(), 0 );
+
+	const unsigned char* srcData = src.getPtr();
+	unsigned char* dstData = dst.getPtr();
+	
+	swr_convert( m_audioConvertContext, &dstData, dst.getSize(), &srcData, src.getSize() );
+	
+	dst.setNbSamples( src.getNbSamples() );
+}
+
+}
diff --git a/src/AvTranscoder/AudioTransform.hpp b/src/AvTranscoder/AudioTransform.hpp
@@ -0,0 +1,30 @@
+#ifndef _AV_TRANSCODER_AUDIO_TRANSFORM_HPP
+#define _AV_TRANSCODER_AUDIO_TRANSFORM_HPP
+
+#include "common.hpp"
+
+class SwrContext;
+
+namespace avtranscoder
+{
+
+class AudioFrame;
+
+class AvExport AudioTransform
+{
+public:
+	AudioTransform();
+
+	void convert( const AudioFrame& src, AudioFrame& dst );
+
+private:
+	bool init( const AudioFrame& src, const AudioFrame& dst );
+	
+	SwrContext* m_audioConvertContext;
+
+	bool m_isInit;
+};
+
+}
+
+#endif
diff --git a/src/AvTranscoder/DatasStructures/AudioDesc.cpp b/src/AvTranscoder/DatasStructures/AudioDesc.cpp
@@ -1,4 +1,5 @@
 #include "AudioDesc.hpp"
+#include "AudioFrame.hpp"
 
 extern "C" {
 #ifndef __STDC_CONSTANT_MACROS
@@ -209,5 +210,16 @@ const AVSampleFormat AudioDesc::getSampleFormat() const
 	return m_codecContext->sample_fmt;
 }
 
+AudioFrameDesc AudioDesc::getFrameDesc() const
+{
+	AudioFrameDesc audioFrameDesc;
+	
+	audioFrameDesc.setChannels( m_codecContext->channels );
+	audioFrameDesc.setSampleRate( m_codecContext->sample_rate );
+	audioFrameDesc.setSampleFormat( m_codecContext->sample_fmt );
+	
+	return audioFrameDesc;
+}
+
 
 }
diff --git a/src/AvTranscoder/DatasStructures/AudioDesc.hpp b/src/AvTranscoder/DatasStructures/AudioDesc.hpp
@@ -18,6 +18,8 @@ extern "C" {
 namespace avtranscoder
 {
 
+class AudioFrameDesc;
+
 class AvExport AudioDesc
 {
 public:
@@ -48,6 +50,8 @@ class AvExport AudioDesc
 	AVCodecContext* getCodecContext() const { return m_codecContext; }
 #endif
 
+	AudioFrameDesc getFrameDesc() const;
+	
 private:
 	void initCodecContext( );
 

Original file line number	Diff line number	Diff line change
`@@ -69,6 +69,7 @@ audioRewrapper = env.Program(`
`69`	`69`	`'avformat',`
`70`	`70`	`'avcodec',`
`71`	`71`	`'swscale',`
	`72`	`+ 'swresample',`
`72`	`73`	`]`
`73`	`74`	`)`
`74`	`75`
Original file line number	Diff line number	Diff line change
`@@ -18,6 +18,8 @@ extern "C" {`
`18`	`18`	`namespace avtranscoder`
`19`	`19`	`{`
`20`	`20`
	`21`	`+class AudioFrameDesc;`
	`22`	`+`
`21`	`23`	`class AvExport AudioDesc`
`22`	`24`	`{`
`23`	`25`	`public:`
`@@ -48,6 +50,8 @@ class AvExport AudioDesc`
`48`	`50`	`AVCodecContext* getCodecContext() const { return m_codecContext; }`
`49`	`51`	`#endif`
`50`	`52`
	`53`	`+ AudioFrameDesc getFrameDesc() const;`
	`54`	`+`
`51`	`55`	`private:`
`52`	`56`	`void initCodecContext( );`
`53`	`57`