Hay una idea que circula cada vez más: con IA ya no hace falta aprender SQL, le preguntas en español y te da la query. Es parcialmente cierta. Y que sea parcialmente cierta es exactamente lo que la hace peligrosa.
El SQL de 2026 cambió. BigQuery tiene funciones nativas para llamar a Gemini desde dentro de una query. Databricks tiene ai_query() que corre un LLM sobre cada fila de tu tabla. Y sí, Claude Sonnet 5 o GPT-5.6 pueden escribirte queries decentes para esquemas bien documentados. Pero si no entiendes lo que lees, no puedes verificarlo, ni optimizarlo, ni debuggearlo cuando devuelve el número equivocado a las 3 am. Lo que cambió es el flujo de trabajo del analista, no SQL en sí.
AI Functions en SQL: qué son y para qué sirven hoy
BigQuery fue uno de los primeros warehouses en traer funciones de IA directamente al SQL. Desde enero de 2026, AI.GENERATE y AI.GENERATE_TABLE están disponibles para todos (GA). En preview reciente sumaron tres más: AI.IF, AI.SCORE y AI.CLASSIFY. Lo que hacen es simple pero poderoso: te permiten llamar a Gemini desde una query sin salir de SQL.
Ejemplo concreto: tienes una tabla de reviews de clientes y quieres clasificar cuáles son negativas. Con AI.IF escribes algo como SELECT customer_id, review_text, AI.IF(review_text, 'Is this review negative?') AS is_negative FROM customer_reviews. Esa query clasifica cada fila sin que tengas que exportar datos, armar un script de Python, ni conectar una API externa. Todo vive en BigQuery, con los costos y permisos del warehouse.
En Databricks, el equivalente es ai_query(). La función te permite llamar a cualquier LLM hospedado en Databricks Model Serving desde SQL: SELECT order_id, ai_query('databricks-meta-llama', CONCAT('Clasifica este comentario: ', customer_comment)) AS category FROM orders. El resultado va directamente a tu tabla de staging, sin mover datos fuera del lakehouse.
Esto no reemplaza al analista. Requiere que sepas escribir SQL correcto, que entiendas cómo estructurar el prompt dentro de la función, que controles el costo por token (que se suma al costo del warehouse), y que valides que los resultados sean consistentes antes de usarlos en un dashboard de negocio. Las AI Functions son una capa nueva encima de SQL —no un reemplazo.
Text-to-SQL: lo que funciona bien y lo que no
Las herramientas de text-to-SQL mejoraron mucho en 2025-2026. Claude Sonnet 5, GPT-5.6 y Gemini 3.5 Pro generan queries usables para tablas bien documentadas con nombres de columnas descriptivos. Para consultas simples tipo 'dame las ventas del último trimestre por producto', la query que devuelven es correcta el 70-80% de las veces.
Donde se rompe: esquemas con 200 columnas con nombres crípticos (fld_amt_net_usd_ytd), joins no obvios que implican lógica de negocio, filtros que requieren conocimiento de cómo se ingieren los datos, o cualquier caso donde 'lo que el usuario pregunta' y 'lo que realmente necesita la query' no son exactamente lo mismo. He visto equipos adoptar text-to-SQL sin revisar las queries y llegar a dashboards que se ven bien pero tienen errores sutiles que nadie detecta hasta que alguien hace la cuenta a mano.
La regla práctica: el texto-a-SQL es un punto de partida, no el resultado final. Siempre revisar la query generada antes de ejecutarla en producción. Y para poder revisarla, necesitas saber SQL.
Por qué SQL sigue siendo el skill más rentable para analistas
SQL lleva más de 40 años siendo el lenguaje estándar para acceder a datos estructurados en empresas. BigQuery lo habla, Databricks lo habla, Snowflake lo habla, Redshift lo habla, incluso Pandas tiene una API de SQL. No hay señal de que eso cambie en el mediano plazo.
La combinación SQL + IA es más poderosa que cualquiera de los dos solos. El analista que sabe SQL puede aprovechar las AI Functions de BigQuery, puede validar lo que genera un LLM, puede construir los datasets que alimentan dashboards de Power BI. El analista que solo usa text-to-SQL sin entender las queries que ejecuta está dependiendo de que el modelo no alucine —y eso pasa.
El analista que domina SQL y sabe usarlo con IA va a correr el doble de rápido que quien solo sabe uno de los dos. Esa ventaja competitiva ya se nota en los procesos de selección de 2026: JDs de Data Analyst en startups de LATAM ya piden experiencia con AI Functions o text-to-SQL pipelines, encima del SQL tradicional.
Cómo prepararte para el SQL de 2026: el orden que tiene sentido
Primero, fundamentos sólidos. No hay atajos aquí: JOINs de todos los tipos, subqueries, CTEs (Common Table Expressions), window functions. Sin eso no puedes interpretar ni corregir lo que genera la IA, y tampoco puedes aprovechar las AI Functions de BigQuery de manera eficiente.
Segundo, trabajar con un warehouse real. BigQuery tiene un free tier generoso (10GB de almacenamiento y 1TB de queries por mes sin pagar). Experimenta con AI.IF y AI.GENERATE sobre datos reales, aunque sean datos públicos de Google. Eso ya te da contexto que la mayoría de los analistas no tiene. El curso de SQL para todos es el punto de entrada para los fundamentos —desde SELECT hasta window functions.
Tercero, profundizar en BigQuery específicamente. Las AI Functions, la integración con Gemini, la sintaxis de GENERATE_TABLE para procesar columnas completas con IA —todo eso tiene sus particularidades. El curso de BigQuery de cero a héroe va a fondo con el warehouse y cubre las capacidades más modernas de la plataforma.
Cuarto, integrar con herramientas de BI. SQL es la fuente; Power BI, Looker Studio o Metabase son el destino. Si quieres el stack completo de un analista moderno, el curso de Power BI para analistas de datos complementa bien el trabajo de SQL. Para quien quiere el camino completo end-to-end, la ruta Data Analyst cubre SQL, Python para análisis y visualización en un solo programa.
Honestamente, la mejor inversión de tiempo que puede hacer un analista de datos en 2026 no es aprender a promtear mejor. Es construir una base sólida de SQL que le permita aprovechar todo lo que ya llegó y lo que sigue llegando. Las AI Functions de BigQuery van a seguir creciendo. Databricks va a sumar más capacidades de LLM en SQL. El que entiende el lenguaje base tiene ventaja en cada nueva ola.
