Hoy en día nos encontramos cara a cara constantemente con estadísticas, ya sea en las noticias, en el trabajo, o incluso en las redes sociales. Esto supone controlar una terminología técnica sobre el campo de la estadística que a veces puede ser difícil de comprender. En este post queremos hacer una lista de las palabras clave en estadística que debes conocer.

Relacionado con los datos
  • Dato: información sobre algo concreto que permite su conocimiento exacto o sirve para deducir las consecuencias derivadas de un hecho. Existen tres grandes grupos de datos:
    • Datos cuantitativos (numéricos): tienen significado como medida o son resultado de un recuento. A su vez pueden ser:
      • Discretos: representan elementos que pueden ser contados y adoptan valores posibles de enumerar.
      • Continuos: representan mediciones y sus valores posibles no se pueden contar.
    • Datos cualitativos (categóricos): representan características como el sexo o el estado civil y pueden adoptar valores numéricos, pero estos no tienen un significado.
    • Datos ordinales: combinación de los datos cuantitativos y cualitativos, donde los datos se ordenan por categorías y estas categorías tienen significado.
  • Base de datos: conjunto de datos organizado de tal modo que permita obtener con rapidez diversos tipos de información. Las bases de datos pueden ser según su flexibilidad de modificación, dinámicas o estáticas, y según su forma de organización, jerárquicas, relacionales, transaccionales, de red, deductivas y multidimensionales.
  • Ciencia de datos: exploración y análisis de datos para una mejor comprensión, extraer conocimiento y formular resultados.
  • Conocimiento: resultado que genera el análisis de la información obtenida y que se contempla con conocimientos previos así como la propia experiencia del receptor.
  • Información: conjunto de datos que una vez procesados pueden ofrecer un mensaje.
  • Procesamiento de datos: aplicación sistemática de una serie de operaciones sobre un conjunto de datos, generalmente por medio de máquinas, para explorar la información que estos datos representan.
Relacionado con la ciencia de la estadística
  • Aleatorio: que depende del azar. En estadística vinculamos la aleatoriedad principalmente a sucesos o variables, donde a cada uno de los valores le corresponde una frecuencia relativa o de probabilidad.
  • Contraste de hipótesis: procedimiento estadístico mediante el cual se recopilan datos de una muestra y se cotejan con una afirmación referida a un parámetros poblacional.
  • Distribución: lista o función que muestra todos los valores posibles de los datos y la frecuencia con la que aparecen. La distribución más conocida es la Normal, la cual se basa en datos numéricos continuos que forman la campana de Gauss.
  • Estadístico: número que resume los datos recopilados por una muestra, ya sea como porcentaje, promedio, mediana o percentil.
  • Experimento: estudio que impone un tratamiento a los sujetos, controla su entorno y registra las respuestas.
  • Gráfico: figura con que se expresa la relación entre diversas magnitudes.
  • Margen de error: mide la diferencia máxima que puede haber entre los resultados de la muestra y los resultados de la población real.
  • Parámetro: resumen de toda la información de todo un censo en un único número procedente de una variable.
  • Sesgo: inclinación sistemática que está presente en el proceso de recopilación de datos y que da lugar a resultados desviados o engañosos.
  • Tabla de contingencia: tipo de tabla empleada para registrar y analizar la asociación entre dos o más variables.
  • Teorema: proposición demostrable lógicamente partiendo de axiomas, postulados u otras proposiciones ya demostradas.
  • Variable: característica o valor numérico que varía para cada individuo, la cual representa el resultado de un recuento, una categoría o una medición.
Relacionado con la estadística descriptiva e inferencial
  • Estadística descriptiva: resume a través de métodos de tendencia central y variabilidad, las características clave de los datos conocidos de una población o una muestra de la misma.
  • Desviación estándar: estadístico utilizado para referirse al grado de variabilidad de los números de un conjunto de datos.
  • Histograma: representación gráfica de una variable en forma de barras, donde cada barra es proporcional a la frecuencia de los valores representados.
  • Intervalo de confianza: intervalo de valores probables para el parámetro poblacional a partir del estadístico muestral.
  • Media: estadístico más utilizado para medir el centro de un conjunto de datos numéricos.
  • Mediana: valor que divide un conjunto de datos en dos partes iguales, siendo el centro auténtico de los datos.
  • Moda: valor que aparece con mayor frecuencia en un conjunto de datos.
  • Varianza: medida de dispersión definida como la esperanza del cuadrado de la desviación estándar de una variable respecto a su media.
  • Estadística inferencial: realiza inferencias o generalizaciones acerca de una población a través de datos muestrales.
  • Correlación: medida de la tendencia de la evolución de dos variables numéricas.
  • Normalización: ajuste de valores medidos en diferentes escalas para poder realizar posteriormente comparaciones.
  • P valor: número comprendido entre 0 y 1 utilizado en los contrastes de hipótesis para ponderar la solidez de las pruebas.
  • Regresión: proceso estadístico para estimar las relaciones entre variables.
  • Significación: cuando existe una probabilidad muy pequeña de que haya ocurrido por azar, y se genera un número llamado p valor para reflejar dicha probabilidad.
Relacionado con el big data
  • Big Data: almacenamiento de grandes cantidades de datos y aplicación de métodos estadísticos, machine learning y minería de datos para inferir conocimiento.
    • «V» del Big Data: volumen, velocidad, variedad, veracidad, valor, visualización, variabilidad y viabilidad.
  • Business Intelligence: aplicaciones, estructuras y herramientas que permiten el análisis de la información para mejorar y optimizar las decisiones y el rendimiento.
  • Machine Learning: mediante técnicas estadísticas y minería de datos permite que las máquinas aprendan y sean capaces de inferir conocimiento en toma de decisiones.
  • Minería de datos: proceso de descubrimiento de patrones en grandes cantidades de datos.
  • Algoritmos supervisados: obtienen un modelo para clasificar objetos sobre la similitud de sus características.
  • Algoritmos no supervisados: obtienen un modelo para predecir casos futuros a partir de casos conocidos.
Relacionado con las encuestas
  • Encuesta: procedimiento de recolección de datos mediante el uso de instrumentos previamente diseñados, aplicados a un grupo representativo de la población para detectar ideas, opiniones u otros objetivos que posteriormente se analizaran. Para saber más sobre las encuestas echa un vistazo a este post.
  • Cuestionario: instrumento de medición fundamental para la obtención de datos, formado habitualmente por un sistema de preguntas planteadas y ordenadas de forma coherente. 
  • Censo: examina todas las unidades de una población.
  • Muestreo: examina ciertas unidades con el objetivo de que los resultados sean representativos para el total de la población. Para saber más sobre el muestreo estadístico echa un vistazo a este post.
  • Muestra aleatoria: muestra de la población que es seleccionada con igualdad de oportunidades.
  • Población: grupo de elementos o unidades que se desea estudiar para responder a la pregunta que da pie a la investigación.
Relacionado con perfiles profesionales
  • Arquitecto Big Data: especialistas capaces de diseñar sistemas de información y de tecnología big data.
  • Arquitecto de datos: profesional que se encarga de que las estructuras de los datos sean las apropiadas para la consecución y los objetivos del proyecto.
  • Analista de datos: su labor principal es la de extraer información útil de las bases de datos disponibles.
  • Analista de negocio: posee una visión global del campo en el que se desarrolla el proyecto y conocimientos técnicos suficientes para definir los objetivos del proyecto, colaborar y cooperar junto con el resto de especialista del proyecto.
  • Científico de datos: su labor principal es la de aplicar los modelos estadísticos o algoritmos de machine learning en los proyectos.
  • Estadístico: apoya metodológicamente a los científicos y analistas de datos en los procesos de transformación de datos en información.

En LETSTAT ofrecemos cursos de formación sobre muchos de estos temas. No dudes en contactar con nosotros si necesitas más información.

Si te han parecido interesantes estas palabras clave en estadística, ¡compártelo y síguenos también en todas nuestras redes sociales para no perderte nada!

Publicado el 28 de septiembre de 2021