En este post les explicare de una manera bastante sencilla distinguir los componentes principales de una tarjeta de sonido, pasando primero por el hardware y posteriormente a como interactúan en las aplicaciones de nuestro sistema operativo.
Hardware de una Tarjeta de sonido:
El componente principal de una tarjeta de sonido es su procesador, así como el de un computador común pero en este caso al tratarse de un dispositivo que solo interactúa con señales, que en este caso hablamos de señales de audio, este componente pasa a ser un DSP (Digital Signal Processor) que significa Procesador de Señales Digitales, que en el fondo es el Chipset de este dispositivo conocido tambien como Procesador de sonido (Sound Processor).
¿Como los reconocemos?, suele ser el chip mas grande que veamos en la placa de sonido. Fabricados por Creative, C-Media, E-Mu (Creative), VIA, Xilinx y muchos más:

DSPs
DSP: Este componente de la tarjeta de sonido es el encargado tanto de recibir como de enviar las señales de audio de nuestro computador además de ser el núcleo de comunicación entre el software y hardware para las señales de audio. Obviamente como las siglas DSP hacen referencia a señales digitales nos indica que solo trabaja con señales digitales por lo que este componente necesita obligatoriamente otros componentes mas para poder transformar la señal digital a analógica (D/A), en caso de enviar sonido analógico, como también un componente que transforme una señal analógica a digital (A/D) para poder recibir una señal de audio analógica.
Para que quede más claro, el esquema de cómo trabaja el DSP es el siguiente:
Esquema entrada salida de un DSP
Si se preguntan porque aparece un filtro en el esquema, se debe a que los componentes A/D y D/A trabajan en cierta frecuencia y por ello se filtra la entrada para que no reciba señales mas allá de las que puede percibir en el caso del A/D, y en el caso del D/A es para lograr el mejor rendimiento dentro del margen de frecuencia en el que trabaja este otro componente.
Conversores de Señales:
Siguiendo el camino del DSP nos encontramos con otros componentes llamados DAC (Digital-to-Analog Converter), que significa Conversor Digital a Analógico, y ADC (Analog-to-Digital Converter) que significa Conversor Analógico a Digital. Estos componentes son los que encontraremos antes de llegar al DSP que corresponderán a la salida y entrada respectivamente. Sin embargo la comunicación entre el DSP y los componentes de conversión necesitan de algún Codec (Compresor-Decompresor) para la comunicación del código digital codificado y poder realizar la transmisión digital, así que también es posible que vean algún otro chip entre estos 2 componentes como el codec AC97 por ejemplo.
¿Como son estos componentes de conversión?, es un chip que puede ser utilizada para un par de canales como también para varios:


DAC y ADC
Pero antes de referirnos a ellos es necesario tener unos conceptos claros:
Hay que entender primero que una tarjeta de sonido trabaja con "sonido", valga la redundancia, que esta destinadas a nosotros que tenemos un rango de frecuencia de audición limitada entre 20Hz a 20Khz.
Para dejar claro el tema, nosotros escuchamos dentro de un rango de "volumen" y de frecuencia que se refleja en el siguiente grafico:

Rango de Audicion humana
En el grafico aparece el parámetro Frecuencia medido en Hz y otro nuevo llamado "Sound Level" (Nivel de sonido, que para nosotros es el volumen o intensidad del sonido) que esta medido en dB. ¿Qué quiere decir este parámetro de Nivel de sonido?, nosotros no escuchamos simplemente dB (decibeles) lo que nosotros escuchamos es "presión sonora" o acústica, el mismo tipo de presión que ejerce el aire o agua como el de otros fluidos. El umbral de audición que tenemos esta a 20 (microPascales) y en cambio el umbral del dolor se encuentra a 20 (Pascales), y como verán la magnitud de estos valores es bastante grande y por ello las transforman en dB, donde 0dB vienen siendo nuestro umbral de audición y los 120-130dB viene siendo el umbral del dolor. Estos dB estan referidos a "Presion Sonora".
Otra cosa que hay que entender es que nosotros escuchamos señales analógicas y ese tipo de señales son las que mueven el cono de un parlante o altavoz.
Una señal analógica se representa de la siguiente forma:

Señal Analogica
Esa es una señal analógica y la magnitud de esta viene siendo el "volumen" para nosotros, en cambio una digital se representa de la siguiente forma:

Señal Digital
¿Y ahora como se relacionan?, pues hay un teorema que nos permite entender una señal analógica transformándola en una digital y este teorema es llamado Teorema de "Nyquist-Shannon" (teorema de muestreo), el cual nos dice que para poder convertir una señal analógica con cierta frecuencia en una digital es necesario que la señal digital tenga una frecuencia que sea el doble de la analógica, es decir que si queremos transformar una señal analógica de 20Khz a una digital, es necesario que la señal digital sea como mínimo de 40Khz. La frecuencia de muestreo viene siendo la frecuencia de esa señal digital que permitirá capturar muestras de la señal analógica.
Bueno, una vez ya entendido lo anterior podemos seguir revisando el trabajo que realizan los componentes de conversión de señales, pero empezaremos por la entrada de sonido (A/D).
ADC (A/D): Este componente es el que recibe la señal analógica y se encarga de transformarla en una digital pero generalmente estos componentes poseen una frecuencia de muestreo igual o superior a 44.1Khz.
La señal se captura de la siguiente forma:
Señal Analogica y Señal Muestreada
Cada punto le permite al componente registrar la frecuencia y magnitud de la señal analógica.
DAC (D/A): Este componente es el encargado de transformar la señal digital que maneja el DSP, que en el fondo viene siendo los archivos y sonidos que reproducimos en nuestro computador) en una señal analógica, actualmente los DAC tienen frecuencia de muestreo igual o superior a 48Khz.
Lo que comentare a continuación es valido para ambos componentes (A/D y D/A):
Ahora se preguntarán; ¿Por qué actualmente las tarjetas de sonido soportan una frecuencia de muestreo mayor a 40Khz?, ya que muchos verán que vienen con 44.1Khz o 48Khz, 96Khz, 192Khz, etc. Y no es precisamente para que escuchemos frecuencias sobre 20Khz a pesar de que la tarjeta tiene la capacidad de hacerlo, sino que es para capturar la señal analógica con mucha más fidelidad (que se parezca a la original).
Para entender este detalle pondré un ejemplo con imágenes. Supongan que la señal analógica que esta tratando es la siguiente y el muestreo realizado son los puntos marcados que se ven en la señal.

Señal analogica y puntos de muestreo que se capturan
Como ven, los puntos capturados no necesariamente representan la magnitud real de la señal original, se podría decir que es cuestión de "suerte". La probabilidad de capturar la magnitud máxima es la misma que se tiene de fallar y capturarla con una magnitud "cero" y por ellos se suele utilizar frecuencias de muestreo mayores, y se puede decir que mientras mas grandes sea la frecuencia de muestreo es mejor.
Al final la señal analógica convertida por la tarjeta de sonido vendría siendo al siguiente:

Señal real capturada y enviada a la salida anlogica
Y como ven la señal no es exactamente igual a la original, para ellos necesitaríamos muchos mas puntos de captura además de distinguir mas niveles de volumen, aquí es donde aparece otro parámetro que esta en bits.
Bits: Para este caso de los conversores los bits representan el valor de la magnitud de la señal analógica por lo que al final se puede decir que mientras más bits tenga el conversor mas resolución se tiene al momento de recibir una señal.
A pesar de que 44.1Khz y 16bit pueden ser suficientes, ahora pueden entender porque hay tanto afán en los fabricantes de dispositivos de audio digital que les indican Muestreos de 96Khz o 192Khz a resoluciones de 24bits o incluso a futuro se podrían llegar a superar, todo es por tener la señal analógica digitalizada lo mas fiel posible además de otras utilidades sobre las frecuencias de audición humana.
Otro parámetro que sale de la imagen anterior es que se puede apreciar que la señal no sale igual, sale algo distorsionada y en estos componentes de conversión es donde aparece otro parámetro más que es el THD (Total Harmonic Distortion) que significa Distorsión Armónica Total el cual nos indica el porcentaje (%) de distorsión que produce el propio componente aunque también el proceso A/D como de D/A producen su propia distorsión. Obviamente lo que conviene es que este parámetro sea lo mas reducido posible.
THD: Nos indica la distorsión armónica del componente, frecuencias que introduce el mismo, y mientras menor sea la distorsión pues de mejor calidad es este. THD+N (Total Harmonic Distortion + Noise) se refiere a lo mismo pero agregándole el ruido que provoca el componente.
Como todo componente necesita de una alimentación lamentablemente esto nos introduce un ruido estático al cual se le asigna otro parámetro conocido como SNR (Signal to noise ratio) que significa relación señal a ruido (S/N).
SNR: Nos indica la relación que existe entre la señal original y el ruido que introduce el propio componente, como es una relación (división) y el ruido esta abajo nos conviene que este parámetro sea lo mas alto posible, es decir que mientras mas alto sea el valor del SNR mejor es el componente.
Bueno, ya hemos revisado la etapa de conversión pero aun no hemos llegado a la salida de la tarjeta, para ello nos falta un componente más. En el caso de una entrada de línea o de micrófono se realiza un ajuste de impedancia, se regula el voltaje que entra a la tarjeta mediante resistencias para que llegue al conversor A/D, de modo que en el caso de un micrófono como este produce poco nivel de voltaje es necesario tener una baja impedancia pero cuando se trata de una entrada de línea esa impedancia no es la misma ya que una de es milivoltios y la otra es de voltios. Así que pasaremos directamente a la salida de audio.
La etapa de salida del audio una vez que ya tenemos convertida la señal digital en analógica es necesario amplificarla, aquí es donde aparece un componente llamado Amplificador Operacional el cual lo único que hace es amplificar la señal analógica que ha realizado el conversor, aunque también se pueden encontrar con chips que hacen todo en uno.
En el paso entre los DACs y amplificadores pueden encontrarse con una serie e condensadores que son los que estabilizan la señal y también actúan como filtros para obtener el mejor rendimiento entre estos componentes.
¿Cómo son los OpAmp?, es un chip que recibe la señal de los DACs y amplifica la señal para cada par de canales "estéreo" (canal izquierdo y derecho):


Amplificadores Operacionales (OpAmp)
Amplificador Operacional (OpAmp): este componente es el que finalmente amplifica el sonido y nos lo hace llegar a nuestro sistema de audio (parlantes), sin embargo como también necesita un voltaje para alimentarlo nos introduce SNR. En muchas ocasiones pueden encontrarse con que el volumen de cada tarjeta de sonido es distinto y se debe a que el voltaje entregado por este componente final no es el mismo ya que como vieron depende tanto de la señal que envía el DAC como del voltaje con el que se alimenta el amplificador, del voltaje que se alimenta el amplificador es de donde aparece otro parámetro mas indicado por Vrms (Valor RMS). Ese parámetro esta referido al voltaje y suele oscilar entre 1V a 5V dependiendo de la tarjeta.
Una vez que ya hemos salido del hardware de la tarjeta de sonido el fabricante nos puede ofrecer otro parámetro más:
Respuesta de Frecuencia: Este parámetro nos indica el rango de frecuencia que podrá reproducir la tarjeta pero a veces suelen incluir una pequeña variación al final medida en +/-dB (variación promedio), por ejemplo nos pueden indicar que la tarjeta tiene una respuesta de frecuencia de "10Hz-88Khz +/-3dB" y ese ultimo parámetro aparece ya que todo componente electrónico no son lineales (para cualquier frecuencia la magnitud no se comporta igual), sin embargo como nuestro rango de frecuencia se encuentra entre los 20Hz a 20Khz se puede activar un filtro a la salida y así obtener una variación mucho mejor, por ejemplo la respuesta de frecuencia obtenida en 20Hz 20Khz tendría una variación de +/-0.3dB. Lo que conviene es que esta variación promedio sea lo mas pequeña posible.
Finalmente ya tenemos el conocimiento para entender que quiere decir los parámetros básicos que nos indica el fabricante de acuerdo a su tarjeta de sonido.
Parámetros que nos podemos encontrar en una tarjeta de sonido:
SNR (Relación señal a ruido): Nos indica el ruido (el ruido de fondo) que introduce la tarjeta en relación a la señal que entrega y se mide en dB, mientras mas grande sea ese valor nos indica que la tarjeta introduce menos ruido en la señal. Mientras mas grande sea este valor es mejor.
THD (Distorsión Armónica Total): Indica la distorsión armónica total de la tarjeta, señales (frecuencias armónicas) que se introducen que no pertenecen a la señal original, este parámetro se mide en % y mientras más pequeño es este valor nos indica que la tarjeta introduce menos distorsión de armonicos. Mientras mas pequeño sea este parámetro es mejor. THD+N es la misma distorsión pero agregándole el ruido (N=Noise).
Vrms: Es el voltaje en RMS (valor efectivo) que entrega en la salida analógica.
Nivel Máximo (Peak Level): Es la magnitud máxima que puede entregar la tarjeta de sonido antes de distorsionar.
Nivel Nominal: Es el valor donde mejor rendimiento se obtiene, es idealmente utilizado para la grabación. Suele estar expresado en dBv y suele estar alrededor de los 0dBv (la "v" hace referencia a los volts).
Margen o Rango dinámico: Relación entre las señales máxima y mínima que son posibles en un sistema. Normalmente se expresa en dB. Y mientras mayor sea este valor nos indica que el dispositivo es mejor.
Rate Sample o Tasa de Muestreo: Puede estar relacionada tanto a los DAC como a los ADC, mientras mayor sea la tasa es mejor ya que se obtienen más muestras. Este parámetro debe estar indicado también por la cantidad de bits que utiliza para la resolución. Cabe destacar que el DSP debe soportarlo ya que de lo contrario realizara un "re-sampleo" para reducir la tasa de muestreo y así pueda trabajar, lo indico ya que antiguamente se podía encontrar con tarjetas de sonido así, pero actualmente no.
Stereo Crosstalk (Diafonía): Esto nos indica los dB que se cruzan entre canales contiguos, por ejemplo la señal del canal derecho se puede oír en el canal izquierdo. Y mientras mas pequeño sea este valor es mejor (se mide en –dB), ósea mas débil se escucha en el canal contiguo que es lo que finalmente se quiere.
IMD: InterModulation Distortion o Distorsión de Intermodulación, distorsión que añade nuevas frecuencias que son la suma o resta de las frecuencias de entrada. Este parámetro se mide en % y mientras mas pequeño sea nos indica que es mejor ya que introduce menos distorsión. Este tipo de distorsion anula la magnitud en otras frecuencias y de acuerdo a este parámetro es como se mide cuando un sistema de audio no es lineal que conlleva a la variación de dB que vemos en la respuesta de frecuencia.
Frecuencia de Respuesta: Es el rango de frecuencia que reproduce la tarjeta de sonido medido en Hz, debería estar acompañado con al variación promedio medida en +/-dB y mientras menos sea esa variación es mejor.
Bueno, una vez que ya entendemos que quiere decir cada parámetro y no saben cuales tiene su tarjeta les recomiendo que utilicen el software "RightMark Audio Analyzer".
Conexiones de una Tarjeta de sonido:
Mucha gente ya sabe como son las salidas analógicas de la tarjeta como también cuando son estéreo, así que explicare la diferencia que existe en la conexión digital que nos pueden ofrece algunas tarjetas.
Pero antes de comenzar con ellos, ¿Qué diferencia tienen que los conectores sean "dorados" o no?, la capa dorada suele ser un pequeño barniz de oro para proteger el conector contra el oxido para garantizar durabilidad y no para obtener mejor conductividad, aunque si un fabricante le da este barniz a algún conector pues esto también indica que le ha puesto más empeño a la calidad de este.
Conectores Digitales:
Conectores S/PDIF Coaxiales y Opticos
Conexión digital S/PDIF (SPDIF): Esta conexión puede ser tanto de entrada como de salida, "S/PDIF" (Sony/Philips Digital Interface Format) significa Formato de Interfaz Digital Sony/Philips con la cual podrán enviar o recibir señales digital como PCM (modulación por pulso) estéreo Lossless (sin perdida de calidad) o como bitstream (flujo de bits) que en este ultimo normalmente están codificados en formato Dolby Digital (AC-3) o DTS y está limitados a 1.5Mbps Lossy (con perdida de calidad y compresión). Esta conexión normalmente la pueden encontrara en "Coaxial" (conector RCA o XLR) como Óptica (Toslink) aunque también puede venir en conectores minijack (jack de 3.5mm) en el caso de la "Coaxial"como también minitoslink para una señal Óptica.


Conectores HDMI
Conexión digital por HDMI: High-Definition Multimedia Interface o Interfase Multimedia de Alta Definición, como ya sabrán algunos este conector es de multipropósito y tiene varias versiones que en caso del sonido lo que las diferencia es el ancho de banda que ofrecen para ese propósito, las versión 1.1 y 1.2 soportan un ancho de banda de hasta 6Mbps como los formatos Dolby Digital Plus y DTS-HD que si bien son considerados formatos HD son "Lossy" (con perdida), en cambio la versión 1.3 y la futura 1.4 soportan hasta 24,5Mbps. Es capaz de enviar sonido en MPCM (PCM multicanal), formatos de audio sin compresión ni perdida de calidad como son los Formatos Dolby TrueHD y DTS-HD Master Audio que son Lossless (sin perdida de calidad).
Pero tengan en cuenta que cualquier versión de HDMI es capaz de enviar sonido por LPCM (MPCM, PCM multicanal), y el HDMI soporta 8 canales PCM, es decir que si el equipo no tiene el decodificador pero si la conexión HDMI 1.1 o 1.2 debería ser capaz de recibir el MPCM y reproducir el sonido aunque sea DTS-HD Master Audio pero se recomienda verificarlo con el receptor. La restricción del ancho de banda es valido cuando se hace uso del "bitstream".

Conectore Digital DIN G9
Digital DIN: Esta es una conexión digital desarrollada por Creative, donde ofrece sonido por PCM multicanal por LPCM (PCM lineal). Utiliza entre 1-2-3 y hasta 4 salidas digitales PCM (sin perdida de calidad), que es estéreo pero al tener por ejemplo 3 o 4 salidas nos puede ofrecer hasta 6 u 8 canales de audio. Esta conexión se suele ofrecer por un conector Mini-Din G9 (de 9 pines) aunque como ya sabemos la modulacion PCM solo necesitas 2 conductores (como en un cable Coaxial RCA) también se puede adaptar por minijack como se muestra en la siguiente imagen:

Salida digital PCM multicanal atravez de un jack de 3,5mm de 3 divisiones
Aunque como ven este conector es muy pequeño por lo que a lo más podremos obtener de él solo 6 canales (5.1) y en cambio por el Din G9 obtendremos todos. A continuación una imagen del adaptador:

Adaptador de Digital DIN (G9) a jack de 3,5mm
Si bien que si se entiende el concepto de cómo trabaja esta conexión podrán utilizarlas en otros equipos mediante una adaptación del conector, la conexión Digital DIN se diseñó para los sistemas de parlantes digitales de Creative.

Digital DIN en Parlantes Digitales de Creative
Ahora que ya hemos pasado por toda la parte del hardware de la tarjeta de sonido comenzaremos a ver lo que encontramos en el software y las funciones o aplicaciones que nos entrega la tarjeta de sonido a través de este medio.
Interacción entre la tarjeta de sonido y el Sistema Operativo
Como ya hemos visto, el DSP o Chipset de la tarjeta de sonido es el componente que permite la comunicación entre el sistema operativo (softwares) y el hardware. Si bien el DSP es un procesador como cualquiera hay veces que al estar limitado es necesario que algunos procesos se realicen mediante los softwares, es decir que el trabajo de un DSP se puede realizar tanto por hardware como por software. ¿A qué tipos de procesos me refiero? Lo más usual es la generación de efectos de sonido en la tarjeta cuando se realiza la reproducción de algún sonido. Pero para poder realizar esta "comunicación" se hace uso de una API (Application Programming Interface) que significa Interfaz de Programación de Aplicaciones. De acuerdo a lo que acabo de mencionar es de donde se indica la "aceleración por Hardware", que se refiere al proceso que realiza directamente el DSP de la tarjeta, y la "aceleración por Software" donde el DSP pasaría a ser el procesador de nuestro computador que una vez que halla hecho el proceso lo envía al DSP de la tarjeta de sonido.
Y como podrán darse cuenta, el que una tarjeta de sonido pueda ofrecernos aceleración por hardware o por software depende de la API que estemos utilizando y no del potencial real de nuestra placa de sonido.


Logos de algunas APIs de sonido
¿Qué APIs conocemos?, para el caso del sonido las API mas conocidas son las siguientes:
A3D, ASIO, DirectSound, DirectSound3D, FMOD, OpenAL, XAudio, XAudio2, WaveOut, WaveRT, etc. Puede haber muchos más pero estos son los más conocidos pero solo explicare la diferencia que existe entre los más utilizados. Cabe destacar que todos ellos deben estar relacionados con el controlador de la interfase, con el driver de la tarjeta de sonido, ya que de lo contrario no los podrán utilizar debido a que el DSP no reconoce las instrucciones. También cada una de estas APIs tienes sus limitaciones, como por ejemplo algunas son capaces de reconocer solo 2 canales de nuestra tarjeta y en cambio otras puede reconocer todas las salidas y entradas, como también algunas son más "veloces" que otras indicado por latencia medida en milisegundos, supongo que muchos gamers online conocen muy bien que significa la latencia aunque para este caso será mas útil para aquellos que trabajen con instrumentos musicales en su computador.
ASIO: "Audio Stream Input/Output" que en español seria Flujo de Audio de Entrada/Salida, es una API que nos permite trabajar con una baja latencia entre el hardware y software. Nos permite reconocer múltiples salidas y entradas en la tarjeta de sonido por ello mismo es que se utiliza en entornos profesionales para crear audio y así no exista un retardo entre los instrumentos que le conectemos a la tarjeta y los efectos que se generan en los softwares. Para Windows si el driver de tu tarjeta "soporta" de cierta forma el ASIO entonces con el ASIO4ALL podrás agregárselo para utilizar bajas latencias a pesar de tener una placa integrada por ejemplo.
OpenAL: Es una API multiplataforma desarrollada por Creative, ¿Multiplataforma? Si ya que se puede utilizar en diversos tipos de sistemas ya sea desde Linux hasta una XBOX, nos permite aceleración por hardware y aplicar extensiones ademas de permitir salida de audio multicanal. Soporta los efectos con aceleracion por hardware de EAX mediante EFX
Comparaciones que hace falta hacer notar, entre DirectSound y DirectSound3D (DS3D, a partir del DirectX 5) la diferencia es que uno es estéreo y el otro puede reconocer varios canales de salida por lo que se le agrego el 3D, por otro lado permiten aceleración por hardware sin embargo se ha abandonado debido a que necesitaban la capa de abstracción de hardware (HAL) que ha sido eliminada desde el Windows Vista ademas de que DirectSound esta limitado a 48Khz a 16Bit (al igual que WaveOut en XP). Otra diferencia es que XAudio (base del sonido del nuevo DirectX) es estéreo y pasó a reemplazar al DirectSound al igual que el Xaudio2 (a partir del DirectX 10.1 o con SP1) con el DirectSound3D, pero no permiten aceleración por hardware sin embargo el audio que procesan estas APIs puede ser de 96Khz a 24bit. En definitiva el Xaudio y Xaudio2 utiliza un DSP por software como tambien lo es FMOD. Los programas o juegos que utilizan FMOD pueden aprovechar su capacidad de generar efectos (DSP Effects) ya que esta API incorpora el set de efectos EAX 2.0 y actualmente hasta el EAX 3.0 como tope para su tecnologia de efectos en el DSP por software, pero una ventaja al ser una plataforma pensada para aprovecharse de los procesadores nuevos tiene la capacidad de generar "voces virtuales".
Antes de seguir hay otro "parámetro" en una tarjeta de sonido conocido como "Voces", ¿Qué son? ¿Para que nos son útiles? Las voces son la cantidad de "sonidos" que podrá reproducir la tarjeta al mismo tiempo. Por ejemplo si tuviéramos solo 2 voces disponibles para utilizar y en un juego escuchamos 2 explosiones pero vemos una tercera explosión que no oímos se debe a que nuestra tarjeta solo puede utilizar 2 voces y la tercera queda muda. "Voces virtuales" se refiere a generar voces (mezclando la señal) cosa de que se reproduzcan mas "sonidos" pero utilizando las misma cantidad de voces que soporta la tarjeta de sonido, sin embargo este proceso requiere procesadores mas potentes.
Extension de efectos
Extensión de efectos: ¿Qué es?, la extensión de efectos básicamente es útil para generar efectos en tiempo real tan solo llamando a la extensión necesaria, es decir sin la necesidad de realizar un proceso con un software editor previamente. Un ejemplo puede ser el que experimentan cuando le colocan la opción "karaoke" a una música que reproduzcan ya que también tienen la opción de hacer un karaoke con editores de sonido al estilo del conocido "Edit Pro". Pero es utilizada en los juegos, lo del karaoke era solo un ejemplo de un efecto que trabaja en tiempo real, el programador puede ahorrarse el trabajo (procesos de programación de "CPU") de grabar varias veces un mismo sonido con efectos diferentes. El ejemplo mas básico de esto es el eco o reverberación que se pueden oír en un juego al entrara a una caverna o túnel, el programador no necesita grabar varias veces el mismo sonido para ello, si no que llama directamente a estas extensiones que mejoran el ambiente del sonido en función a lo que sucede. Para llamar a estas extensiones es necesario que la API que utilice el juego incluya las instrucciones de llamada como "DirectSound y OpenAL". A continuación veremos cuales son estas extensiones de las APIs.
Entre estas extensiones el más famoso y conocido que tenemos es el EAX, que ha sido desarrollado por Creative Labs.

EAX
EAX: "Environmental Audio Extensions"o Extensión de Audio Ambiental. Antes de indicar que efectos incluye cada versión de esta extensión tienen que entender algo para evitar confusiones que lamentablemente eh visto en un sin numero de foros y paginas. El EAX es solo el efecto que se genera a partir de lo que suceda en el juego y no corresponde a que el sonido sea 4.1 o 5.1 (multicanal), el hecho que pueda trabajar con varios canales no significa que sea un requisito en el juego para disfrutar de un juego con varios canales de audio, ya que incluso podrán utilizarlo en sistemas estéreo 2.0 o audífonos o también en los conocidos sistemas 5.1. Que con EAX (u otras extensiones de efectos) suene mejor se debe a que mejora mucho más el ambiente.
Versiones del EAX:
EAX 1.0
* 8 voces simultáneas en el procesamiento de hardware.
* 32 voces individuales 3D
* Preajustes de Efecto Ambiental
* Renderizado DSP por Hardware.
EAX 2.0
* 32 voces simultáneas en el procesamiento de hardware
* Efectos de oclusión
* Materiales específicos de los parámetros de reverberación

EAX AdvanceHD, incluye un motor de reberveracion mejorado
EAX 3.0
* 64 voces simultáneas en el procesamiento de hardware
* "Suaviza" entre entornos de audio 3D
* Acceso directo a todos los parámetros de reverberación
* Desplazamiento del Medio Ambiente
* Nuevo motor de reverberación
A partir de esta versión se incluye un nuevo motor de reverberación "AdvancedHD".
EAX 4.0
* Los efectos realizados en tiempo real por hardware
* Aplicable a múltiples entornos simultáneos
* Brida
* Eco
* Distorsión
* Anillo de efectos de modulación

Actual tope, EAX 5.0 HD
EAX 5.0:
* 128 voces simultáneas en el procesamiento de hardware y hasta 4 efectos en cada uno
* EAX voz (procesamiento de señal de entrada de micrófono)
* EAX PurePath (Efectos de sonido EAX que puede provenir de un solo altavoz)
* Medio ambiente FlexiFX (cuatro ranuras disponibles efectos por canal)
* EAX MacroFX (efectos de posición realista a corta distancia)
* Medio ambiente de oclusión (sonido de ambientes adyacentes que pueden atravesar las paredes)
El EAX tal y como se conoce en sus inicios prácticamente ya no se utiliza desde que se utiliza DirectX10 o superiores (Windows Vista y superiores). El EAX son efectos procesados por hardware, OpenAL utiliza EAX mediante EFX que es el "reemplazo" en la programación. Por ello es que lo que ahora se le dice EAX son solo el pack o "set" de efectos que lo incluyen una gran cantidad de APIs de sonido que tienen capacidad de generar efectos DSP donde se basan en los estudios realizados por el laboratorio de sonido de Creative Labs para generar efectos de la manera correcta de modo que el resultado sea eficiente y creíble para los oyentes.
Como ya sabemos, todas las tarjetas de sonido incluyen un DSP por lo menos con el que también pueden generar efectos del estilo del EAX, sin embargo extrañamente solo a Creative se le ha ocurrido "ponerles nombre" para poder llamarlos desde un juego. Así que frente a esto al fabricante ASUS se le ocurrió ¿Por qué no hacer lo mismo con el DSP que ofrece mi placa de sonido?, para ello implementó su propia especie de pack de extensión de efectos llamándolo DS3D GX (de la version 2.0 o superiores).
DS3D GX: Es la "extensión de efectos" que ha diseñado ASUS para su DSP que ha sido desarrollado por C-Media, que ingeniosamente deja activar el EAX de Creative en los juegos pero como sabrán el EAX 1.0 y EAX 2.0 son libres así que puede ejecutar esos efectos naturalmente pero su DSP también incluye otros tipos de efectos también que los puede habilitar para ese propósito. Así que el driver de las Xonar permite capturar las llamadas del EAX (incluso las del EAX 5.0) y adapta las llamadas a su extensión DS3D GX 2.0 para ejecutar los efectos, y según ASUS también tiene la necesidad de emular algunos. DS3D hace referencia al DirectSound3D ya que la mayoria de los juegos que soportan EAX estaban basado en esa API, ahora utilizan OpenAL pero tambien el DS3D GX puede capturar estas "llamadas".
Nota: Si la tarjeta soporta el EAX5.0 también soportará todos los otros efectos útiles que no se han actualizado. También el EAX5.0 esta presente solo en Chip X-Fi (CA20Kx), ¿Porque? ¿Y las ASUS Xonar? La serie de ASUS no soporta EAX5.0, utiliza una emulación que no logra generar todos los efectos del EAX5.0 de hecho a lo mas alcanza al EAX4.0, y gran parte de los efectos los realiza por software, el EAX prácticamente pasa a ser el "pack" de efectos para juegos que incluye el DSP (software o hardware) de Creative, solo el EAX 1.0 y 2.0 son "libres". También eh visto mucha confusión en este sentido, por ello ASUS no anuncia que sus tarjetas soportan EAX5.0 solo indica que el driver habilita a que los juegos lo habiliten pero el efecto que ejecuta no será exactamente el mismo que el que ha diseñado Creative, mas bien solo será una alternativa que aun no iguala al original que ha diseñado el laboratorio de sonido de Creative.
¿Emulacion, no entiendo? Cuando se emulan los efectos quiere decir que el trabajo que deberia realizar el DSP de la tarjeta lo realiza el procesador de nuestro PC, pero esta emulacion nos quita recursos de CPU y por ejemplo el "potente" procesador que incorpora ASUS en su serie Xonar al emular el EAX queda reflejado en el siguiente grafico:

Consumo de %CPU vs Voces utilizadas, Xonar Emulado sonido por software y Chip X-Fi Procesando por Hardware
Queda bastante claro que sucede al emular algo por software sobretodo cuando se hace uso de muchas "voces" en un juego utilizando muchos efectos, a pesar de tener un buen procesador. Sin embargo el trabajo depende de la API ya que solo depende de ella si nos ofrece la posibilidad de utilizar el proceso por hardware o nos fuerza a utilizar el software. Si quieren ver que tipo de opciones tiene su tarjeta de sonido para realizar estos Benchmark, les recomiendo que utilicen el "RightMark 3DSound CPU Utilization test".
Ojo, dependiendo de la API que se este utilizando en el programa o juego va a significar si vamos a poder utilizar la aceleración por hardware que nos ofrece el DSP de nuestra tarjeta, que en este caso me refiero al proceso de generar alguno de estas extensiones de efectos sobre los sonidos ejecutándolo en tiempo real. Es decir que si jugamos con OpenAL podremos utilizar los efectos por hardware, si es que el DSP lo permite así, de lo contrario al usar uno como el Xaudio (o adaptación de DirectSound por esa API) o adaptaciones de DirectSound3D a través del Xaudio2 o ejecutados por esta API no podrán ejecutar la aceleración a pesar de que tu tarjeta pueda soportarlo.
¿EAX se va a extinguir? Como ya vieron el EAX es la extensión de efectos que ha diseñado Creative, se puede decir que es su pack de extensión de efectos. Las llamadas de EAX quizás se terminen pero no van a desaparecer si no que los juegos que utilicen la API OpenAL podrán activar las extensiones sin la necesidad de activar una opción "EAX" como antes, si no que el mismo drivers va a permitir llamarlas al reconocer el OpenAL en su diseño aunque actualmente esto se realiza por "EFX" que es el "EAX de OpenAL". Actualmente el EAX lo ocupan muchas APIs con la diferencia que no se necesita soporte de driver o tener aceleración por hardware para ello, simplemente las mismas APIs de ahora generan el EAX mediante Software o por lo menos esa es la tendencia actualmente pero solo hasta el EAX 3.0.
Si aun no tiene muy claro que hacen realmente las extensiones de audio les recomiendo que utilicen el programa "RightMark 3DSound Positioning Accuracy test". Con él podrán hacer distintas pruebas de sonido 3D.
Cambiando de tema, vamos a ver que efectos nos ofrecen las tarjetas de sonido en la suite de aplicaciones que nos suelen ofrecer.
Conjunto de herramientas, funciones y aplicaciones que nos puede ofrecer la suite de la tarjeta:
Cada tarjeta de sonido incluye una serie de utilidades, herramientas y tecnologías de efectos, sin embargo suelen generarse en tanto por software como por hardware. Cada tarjeta puede incluir distintos tipos de suite (pack de programas y utilidades) para mejorar la experiencia del sonido que reproducen, pero estas "mejoras" han sido desarrolladas por laboratorios de sonido y placas de sonido de menos presupuesto a veces incluyen alternativas que no son de la misma calidad pero realizan la misma función. Para que se entienda mejor veremos estas características de los laboratorios mas conocidos.
A continuación veremos cuales son las tecnologías que nos ofrecen los laboratorios de sonido mas conocidos:
Creative Labs
Creative Labs: Posiblemente este es el laboratorio de sonido mas conocido en el mundo de los PC. Eh visto que mucha gente cree que el hecho de que otras placas indiquen suites de Dolby asumen que una de Creative no incluye estas "tecnologías" de sonido surround, pero desconocen que son alternativas y competencia entre ellos.
Pero vamos al grano, a continuación les indicare que realiza algunas utilidades que nos ofrece la suite de Creative para audífono, sistemas de parlantes estéreo como también los sistemas de parlantes multicanales.


Tecnología CMSS-3D de Creative Labs
Creative tiene la tecnología CMSS (Creative Multi-Speaker Surround) la cual es utilizada para los efectos "surround" (sonido envolvente) para aparentar un sistema de varios canales, cada suite como Audigy o X-Fi si bien pueden incluir las mismas "funciones" la versión del efecto es distinta ya que mientras mas nueva sea la suite mas nuevo y mejor es el efecto. Dentro de esta tecnología encontramos los siguientes:
- CMSS-3D: Esta función trabaja con fuentes estéreo y el trabajo que realiza es que a partir de esta fuente estéreo simula un sonido multicanal, por ejemplo lo expande a 5.1 pero con efecto surround bastante realista que también puede hacer un "up-mix" (expansión) a sistemas 6.1 o 7.1. Se utiliza en sistemas multicanales como un 5.1. La nueva version incluye el CMSS-3Dinteractive que ya crea un sonido virtual posicional mas real.
- CMSS-3D Virtual: Convierte el sonido estéreo común o multicanal como el de las películas en Dolby Digital, DTS o sonido de varios canales de los juegos, en un sonido surround virtual estéreo. Útil para sistemas de parlantes estéreo 2.0 o 2.1 que tambien es expadible a sistemas de 4 canales donde los 2 del rear sera un "mono".
- CMSS-3D Headphone: Similar al CMSS-3D Virtual, ya que cumple la misma función, pero esta diseñado para ser utilizado en audífonos donde crea un ambiente virtual como el de sistemas 5.1 o 7.1 bastante realista a pesar de ser audífonos estéreo.
Ahora veremos las otras alternativas que pueden incluir, ya sea la suite de la tarjeta que también incluyen algunos software de reproducción.

Dolby Labs
Dolby Labs: Mundialmente famoso en el cine y también ofrece toda su tecnología al alcance de cualquiera. Sin embargo como este laboratorio de sonido tiene una gran trayectoria hay una gran cantidad de efectos y versiones mejoradas de estos mismos así que solo me referiré a los más actuales con los que podemos toparnos. . Pero primero veremos los formatos de audio que ofrece este laboratorio.
Formatos de audio digital de Dolby más conocidos:

Dolby Digital EX
Dolby Digital (AC-3): Formato de sonido codificado (codec) multicanal 5.1, audio digitalizado a 48Khz a 16bit con una compresión máxima de 640Kbps. Para poder escucharlo se necesita de un decodificador ya sea por software como por hardware que puede estar en el DSP de la tarjeta así como en un decodificador externo, la "EX" hace referencia a sistemas 6.1 o expansión a 7.1 (2 canales mono) basado en el AC-3. Solo DSP de gama media de Creative han incluido decodificador por hardware pero la nueva serie "Titanium" no.
Dolby Digital Plus
Dolby Digital Plus (E-AC-3): Formato de sonido digital hasta 7.1, audio digitalizado a 48Khz a 24bit con una compresión de hasta 6Mbps, considerado como un formato de audio HD a pesar de ser un formato Lossy. Lo encontramos en las películas en DVD-HD y Blue Ray. La decodificación solo se puede realizar por software o por un decodificador externo a través de HDMI.

Dolby TrueHD
Dolby TrueHD: Formato de sonido digital hasta 7.1, este formato de audio esta digitalizado a 96Khz (multicanal) o 192Khz (estéreo) a 24bit y ocupa una tasa de transferencia de hasta 18Mbps, es un formato de audio digital HD Lossless. Lo encontramos en las películas en DVD-HD y Blue Ray. La decodificación solo se puede realizar por software o por un decodificador externo a través de HDMI.

CyberLink PowerDVD
¿Qué software se utiliza para la decodificación de estos archivos?, pues el mas común es el que ofrece CyberLink con el PowerDVD.
Efectos Surround de la Suite de Dolby:
Ahora pasamos a la suite que nos ofrece Dolby, entre ellas actualmente podremos encontrar a futuro "Dolby Home Theater v3" como su tope y Dolby Advanced Audio, antiguamente existían otras como la Dolby Sound Room pero estas son las versiones actuales que al final solo varían en las funciones que nos ofrecen, entre ellas nos encontramos con las siguientes:



Tecnología Dolby Prolocig II/x/z
- Dolby Prologic II/x/z: Esta función trabaja con fuentes estéreo y el trabajo que realiza es que a partir de esta fuente estéreo simula un sonido multicanal, por ejemplo lo expande a 5.1 pero con efecto surround bastante realista. Se utiliza en sistemas multicanales como un 5.1. La x hace referencia a sistemas 6.1 o 7.1 y si la ven sin la "x" es para sistemas 5.1. Si se fijan realiza lo mismo que el CMSS-3D que se ofrece en la suite de Creative. Si ven la "z" acompañando a este efecto, se refiere a la ultima version que se ha diseñado que soporta sistemas de parlante hasta 9.1.

- Dolby Virtual Speaker: El sonido estéreo ordinario lo transforma en uno surround virtual con tan solo 2 parlantes. Útil en sistemas de parlantes estéreo 2.0 o 2.1.

Dolby HeadPhone - Dolby HeadPhone: Realiza el mismo trabajo que el Virtual Speaker pero esta diseñado para ser utilizada en audífonos, crea un ambiente virtual como el de sistemas 5.1 o 7.1 bastante realista.
Como hemos visto la suite de Dolby es solo una alternativa a la suite que ofrece Creative, incluso alguno de estos efectos también son producidos por softwares reproductores o suites menos conocidas que incluyen alternativas a estos efectos que encontramos en algunas placas de sonido integradas. A continuación veremos otra alternativa más que también es de prestigio:

DTS Digital Entertainment
DTS Digital Entertainment: Quizás es menos conocido que Dolby pero es la alternativa o competencia directa cuando escuchamos una película. Pero recién ahora están por aparecer una suite completa de DTS ya que el único "pack" que tenia era el DTSconnect el cual solo incluye DTS Neo:PC y DTSinteractive. La suite mas reciente de DTS es la DTS Surround Sensation UltraPC que incluye los efectos surround; DTS Surround Sensation y DTS NEO:PC (quizás también incluya el DTSinteractive) que explicare un poco mas adelante, primero veamos los fromatos de audio que ofrece DTS.
Formatos de audio digital de DTS más conocidos:

DTS 5.1/ES y DTS 96/24: Todos son formatos de Audio 5.1 y 6.1 canales. Tienen una codificación de 1.5Mbps. Los formatos 5.1 y ES utilizan una frecuencia de muestreo de 48Khz a 16bit pero la versión 96/24 esta a 96Khz a 24bits. Todos son formatos Lossy (compresion con perdida), la "ES" implica extension a 6.1.

DTS-HD: Formato de Audio 7.1 (8 canales) digital de 96Khz a 24bits con una tasa de transferencia de hasta 6Mbps, es considerado un formato HD (Alta resolución) pero Lossy.

DTS-HD Master Audio: Formato de audio 7.1 digital codificado a 96Khz a 24bit para sonido multicanal y 192Khz a 24bits para sonido estéreo. La tasa de transferencia es de hasta 24.5Mbps. Considerado Audio HD Lossless.
Efectos Surround de la Suite de DTS:
- DTS NEO:PC: Esta función trabaja con fuentes estéreo y el trabajo que realiza es que a partir de esta fuente estéreo simula un sonido multicanal, por ejemplo lo expande a 5.1 pero con efecto surround bastante realista. En los HomeTheater pueden encontrar su equivalente llamado DTS Neo6 que se incluía también en las suites de Creative Audigy 2 o 4.

- DTS Surround Sensation: Realiza el mismo trabajo que el DTS NEO PC pero esta diseñado para ser utilizado en audífonos como en parlantes estéreo, crea un ambiente virtual como el de un sistemas 5.1 bastante realista y mejorado.
Como ya conocemos la utilidad de estas suites de los laboratorios cabe destacar que pueden ser utilizados en todo tipo de placas de sonido, el problema es que no todos los fabricantes están dispuestos a pagar para ello, en el caso de Creative esta enlazado a su DSP y drivers. Las suites de Dolby y DTS también las pueden encontrar en softwares de reproducción de sonido como el ya comentado PowerDVD.
Ojo, dependiendo de la API que se este utilizando en el programa o juego va a significar si vamos a poder utilizar la aceleración por hardware que nos ofrece el DSP de nuestra tarjeta, que en este caso me refiero al proceso de generar efectos sobre los sonidos que se ejecutaran en tiempo real. Es decir que si juegan bajo Xaudio estan obligados a utilizar "aceleracion por software", en cambio si utilizan el OpenAL esos efectos los podran ejecutar por hardware si es que el DSP de la tarjeta lo permite para asi aliviar el trabajo que realiza CPU. Este comentario va referido a los efectos que acabamos de ver.
Codificadores en tiempo real:
Como ya sabemos la función de los formatos de audio digitales que nos ofrece tanto Dolby como DTS, es necesario dejar claro un tema. Todos los HomeTheater o HomeCinemas 5.1 poseen entrada digital S/PDIF y resulta que por ese medio solo puede recibir 3 tipos de señales o formatos de audio digitales, como sabremos el Dolby Digital y DTS son formatos de audio 5.1, sin embargo cuando nuestra tarjeta de sonido no esta reproduciendo ese tipo de formatos no es capaz de enviar sonido multicanal a través de un solo enlace (en este caso me refiero al S/PDIF), así que frente a ese problema que se fue presentando estos laboratorios desarrollaron codificadores en tiempo real que codifican todo el sonido que reproduce nuestro computador, todo lo que manipula nuestra tarjeta, a formatos multicanal 5.1 que son los siguientes:
- Dolby Digital Live: Codifica todo el sonido que produce la tarjeta a formato Dolby Digital 5.1 con un muestreo de 48Khz a 16bits y utilizando un ancho de banda de 640Kbps (compresión).

- DTS Interactive: Codifica todo el sonido que produce la tarjeta a formato DTS 5.1 con un muestreo de 48Khz a 16bit pero utilizando un ancho de banda de 1.5 Mbps, mayor a la alternativa de Dolby.
Básicamente la diferencia viene siendo como si compararan un MP3 de 128Kbps contra uno de 320Kbps, aunque la técnica de compresión utilizada en ambos formatos no es el mismo, así que si bien el DTS es mejor ocupara mas recursos de CPU probablemente y en este caso quizás el formato de Dolby obtenga mejor rendimiento al ser mas liviano. Sin embargo les conviene probar que resultados les ofrece antes de elegir directamente uno de ellos, tanto en calidad como rendimiento.

THX: Este logotipo indica una certificación de calidad (control de calidad), tengan muy claro que no es un "Formato de Audio" o "Efecto de Sonido" como lo que ofrece laboratorios de Dolby o DTS. Cuando lo encontramos en tarjetas de sonido, además de "certificar" la calidad de esta, nos suele ofrecer unas herramientas para que calibremos filtros como la magnitud del sonido que reproducen los parlantes.
Este tipo de certificación se encuentra en varios productos destinados al audio como también en su fuerte que es el cine y películas, pero a la vez tiene muchos tipos de certificación dentro de los distintos sectores como el cine, tecnologías de audio, películas, sistemas HomeTheater como los parlantes y amplificadores, estudios de audio profesionales, etc.
Conclusiones: Como ya hemos visto todo lo referente al hardware de las tarjetas de sonido, podemos sacar nuestras propias conclusiones:
Ya sabemos en parte los parámetros con los que podemos encontrarnos al mirar las especificaciones de la tarjeta, sin embargo el sonido final que percibimos dependen solo de un 30% de la calidad de nuestra tarjeta de sonido ya que el 70% incluye sus propios parámetros de calidad pero siempre son bastante inferiores a lo que ofrece la tarjeta de sonido, es decir si vimos el THD de la tarjeta esta por debajo del 0.001% en los parlantes nos encontramos con 10% de THD para bajo, el SNR generalmente esta por sobre los 100dB en la tarjeta y en cambio la gran mayoría de los sistemas de parlantes esta de 100dB para abajo, etc. Y como ven, gran parte de la calidad que logra la tarjeta se deteriora por culpa del "dispositivo" final que transforma la señal eléctrica en señales de ondas acústicas.
Así que como conclusión, no hay que volverse loco tratando de que los parámetros de calidad sean increíblemente buenos. Pero tampoco es necesario tener un sistema de audio que nos cueste un ojo de la cara para poder aprovechar una buena tarjeta de sonido externa, que no son caras una vez que entendemos como trabajan finalmente. Solo hay que hacer la elección correcta según lo que busquemos.
Si alguien se pregunta, ¿Y las tarjetas de sonido profesionales y semi-profesionales? Pues no son muy diferentes a lo que acabamos de ver, la gran diferencia que tienen es que nos ofrecen diversos tipos de entrada ya adaptadas (impedancia) para el instrumento que vallamos a utilizar y salidas que incluso a veces incluyen hasta pre-amplificadores (entregan mas Volts en la salida) pero la calidad como vieron depende del componente que este en la entrada/salida y varias placas de uso "domesticas" (de entretención) pueden ofrecer la misma calidad que una profesional, aunque en muchas ocasiones las tarjetas de sonido profesional incluyen mas de un DSP y gracias a eso tienen muchas mas capacidad de entrada y salidas.
Todo lo que eh comentado no es para que necesariamente compremos una tarjeta de sonido mejor, sino para que sepamos realmente que diferencias hay entre cada modelo según el uso que le vallamos a dar como también entender para que nos son útiles las diversas aplicaciones que nos ofrece la tarjeta de sonido (sea integrada o dedicada) de acuerdo al sistema de audio que tengamos.
PD: Espero que este post les despeje muchas dudas que tenían sobre las tarjetas de sonido, ya que me eh dado cuenta que hay información pero desordenada y con muchos tecnicismos que muchos desconocen así que traté de explicarlo de la manera mas sencilla.
Saludos
Este tema ha sido editado por T-1: 12 February 2010 - 03:29 PM

Ingresar
Registrar
Ayuda

Compartir
Del.icio.us
Twitter
Digg
Email
Facebook
Google
Mixx
Reddit
StumbleUpon

MultiCitas
















