domingo, 17 de febrero de 2013

Data Análisis - Distribución Normal


También llamada distribución gaussiana. La distribución normal es una de las distribuciones que una variable aleatoria continua puede poseer. Muchos fenómenos del mundo real se aproximan a la distribución normal.

Data Análisis - Función de densidad



  • Función de densidad (density function)
    La curva de la distribución de probabilidades para una variable aleatoria continua. Se puede dibujar una aproximación dibujando el poligono de las frecuencias relativas de la muestra.

sábado, 16 de febrero de 2013

Data analisis - Distribucion Geométrica

Podemos definir la distribución geométrica, también llamada distribución de Pascal como un caso particular de la distibución binomial negativa donde el núero de éxitos buscados es 1.

Data Análisis - Distribucion Bionmial Negativa

 
La distribución binomial negativa se aplica para determinar la probabilidad de que durante m repeticiones de un experimiento un resultado ocurra n. Los experimentos de la distibución binomial negativa deben cumplir las características de los experimentos de Bernoulli. Es decir:

viernes, 15 de febrero de 2013

Data Análisis - Distribución de Poisson

La distribución de poisson se aplica para determinar el valor de una variable aleatoria discreta que mide ocurrencias de un suceso dentro de un intervalo (ya sea este de espacio, volumen, tiempo...).

Data Análisis - Distribución Binomial


La distribución binomial se aplica para determinar la probabilidad de que un resultado ocurra n veces durante m ejecuciones de un experimento que cumple las características de los experimentos de Bernoulli. Es decir, el experimentos cumple:

Data Análisis - Distribucion de Bernoulli


La distribución de Bernoulli es también llamada distribución dicotómica. Es la distribución de probabilidad discreta resultante de la ejecución de experimentos de Bernoulli. Los experimentos de Bernoulli cumplen las siguientes características:

Data Análisis - Variables Aleatorias

  • Variable aleatoria (random variable)
    Aquella que depende del resultado de un experimento aleatorio.

jueves, 14 de febrero de 2013

Data Análisis - Probabilidad


la probabilidad mide la posibilidad de uque un evento ocurra. Es una parte importante de la estadística y la base de las inferencias estadísticas, donde la probabilidad mide la incertidumbre de las decisiones.

Data Análisis - Combinatoria


Cuando hablamos de combinatoria hay que distiguir entre dos tipos de grupos de elementos: combinaciones y permutaciones. La diferencia entre combinación y la permutación es la importancia en el orden de los elementos. La combinación no distingue los grupos con los mismos elementos y distingo orden, mientras que la permutación si.

miércoles, 13 de febrero de 2013

Data Análisis - Teorema de Chebyshev


El teorema de Chebyshev relaciona la desviación típica y el número de elementos alrededor de la media. El cálculo es independiente del tipo de distribución de la muestra.

Data Análisis - Medidas descriptivas

Las medidas descriptivas nos permiten explicar las características de una muestra mediante un conjunto de propiedades que nos muestran como se distribuye la nube de datos.

lunes, 11 de febrero de 2013

Data Análisis - Agrupando el dato


  • Dato crudo (raw data)
    El dato tal cual es recolectado. Este es de gran volumen denso y puede contener errores.

Uno de los primeros pasos para estudiar el data puede ser el agrupamiento del dato en categorías o clases. De forma que podamos estudiar como se distribuye la población dentro de cada clase o categoría. Para ello utilizamos:

sábado, 9 de febrero de 2013

Data Análisis - Conceptos básicos de estadística


Dentro del análisis de datos llamamos estadística al conjunto de métodos usado para analizar, peresentar e interpretar datos. Nunca se debe perder el objetivo de todo analisis de datos, que es la toma de decisiones fundamentadas en los resultados del análisis.

jueves, 7 de febrero de 2013

El Infiernos de los JAR


Ultimamente he dedicado algo de tiempo a profundizar en OSGI. Ya partía de una idea básica sobre la plataforma, pero quería algo de conocimiento práctico que me llevase a tener algo más de confianza si tenía que usarlo en un futuro. ¿Y por qué hablo de OSGI si titulo al post "El infierno de los JAR"? Pues realmente porque está muy relacionado, y porque me ha encantado encontrarme con una buena explicación de los ClassLoader buscando información sobre OSGI (realmente la justificación de OSGI biene dada por las definiciencias de la carga de clases).

viernes, 11 de enero de 2013

Codility - Diciembre 2012


Una lástima, esperaremos a la solución por parte de codility a ver que nos cuentan. En cualquier caso he disfrutado intentando solucionarlo.

El problema parte de una maya cuadrada de NxN nodos. En cada iteración se rompe la conexión entre dos nodos. El objetivo es indicar en qué punto se rompe la conexión entre el primer nodo y el último.

 

miércoles, 9 de enero de 2013

JVM detrás del proxy


Los proxies es una de las cosas que más se dejan odiar... siempre dan problemas, y según el nivel de seguridad de la empresa puedes pasar más o menos tiempo configurando todas las herramientas para poder alcanzar nuestro adorado internet. Todo, por la seguridad, o el control, o la vigilancia....