Mostrando las entradas con la etiqueta ciencia de datos. Mostrar todas las entradas
Mostrando las entradas con la etiqueta ciencia de datos. Mostrar todas las entradas

martes, 8 de junio de 2021

Crear calendarios usando el paquete calendR

En nuestra búsqueda por paquetes (packages) que agreguen valor al usuario final, nos encontramos con calendR, este paquete creado para el lenguaje de programación R, permite la creación de calendarios mensuales, anuales y lo mejor de todo es que se integra con ggplot2 para la generación de gráficos, en este artículo te mostraremos los aspectos básicos de dicho paquete.





Iniciamos con la instalación del paquete calendR, haciendo uso de la función install.packages("calendR"), continuamos activandolo haciendo uso de la función library() como lo muestra la siguiente imagen.




La función que nos proporciona el paquete para crear calendarios en calendR(), que por defecto genera el calendario del año en curso, para nuestro caso 2021, como muestran las siguientes imágenes.








Para generar el calendario de un año en particular, agregamos la cláusula year, seguido del año sobre el que deseamos generar el calendario, calendaR( year = 1998) , como lo muestra la siguiente imagen.





Terminamos estableciendo un color en especifico para los fines de semana, agregamos las siguiente cláusulas calendR(year = 1998,start = "M", special.days = "weekend", special.col = "blue"), donde start indica que día empieza la semana por defecto para calendaR es Domingo, pero vamos a forzarlo a que empiece el Lunes (M por Monday, lunes en inglés), luego indicamos que son los fines de semana (weekend) lo que deseamos resaltar del resto de días, y finalmente indicamos el color (blue) para resaltar los fines de semana de cada mes del año.




El siguiente vídeo muestra como crear calendarios usando el paquete calendR





martes, 16 de febrero de 2021

Introducción al Data Science - IBM Cognitive Class

Datos, información, conocimiento y decisiones, mejores decisiones, la ciencia de datos (Data Science) es un campo multidisciplinario que reúne modelos estadístico, procesos y sistemas informáticos que nos permitan extraer información y conocimiento de grandes bases de datos, para que las empresas, organizaciones e instituciones puedan tomar mejores decisiones.

El siguiente artículo del Blog Hablamos R te muestra como obtener la certificación Introduction to Data Science, otorgada por el IBM Cognitive Class, que te permitirá tomar tus primeros pasos dentro del mundo de la ciencia de datos, para terminar obteniendo el badge Data Science Foundations.




Ingresamos a la web del IBM Cognitive Class a través de la siguiente url https://cognitiveclass.ai/ que nos permitira acceder a la serie de cursos online y gratuitos enfocados en la ciencia de datos, con el resplado y soporte de IBM, luego vamos por el curso Introduction to Data Science, es desde allí donde comenzaremos a dar nuestros primeros pasos en el mundo de la ciencia de datos (Data Science), este curso incluso te permitira trabajar online con la plataforma de Machine Learning IBM Watson.



Puedes encontrar al curso bajo el nombre Introduction to Data Science,  accede al mismo a través de la siguiente dirección url:https://cognitiveclass.ai/courses/data-science-101  donde se te mostrara una página de bienvenida explicandote sus principales características, éste puede ser tomado en cualquier momento, a tu propio ritmo, con una duración de alrededor de  3 horas para concluirlo, el idioma en que se dicta el curso es en inglés, podras acceder a lecturas especializadas en el rubro de la ciencia de datos (Data Science) y realizar las prácticas online haciendo uso de la plataforma IBM Watson.





El curso consta de 5 módulos:  Defining Data Science, What di data science people do?, Data Science in Business, Use cases for Data Science, Data Science people; cada módulo se divide en distintos capítulos, dependiendo de la complejidad del tema, así como lecturas especializadas, previas a tomar el examen asignado a cada módulo,(Review Questions), al finalizar todos los módulos podras acceder al examen final, el cual podras pasar con el  70% como nota aprobatoria, las siguiente imágenes muestran la estructura del Introduction to Data Science.






Al terminar con todos los módulos del curso,lecturas, y las Review Questions, pasando el examen final de manera satisfactoria, obtienes la certificación INTRODUCTION TO DATA SCIENCE, otorgada por el Cognitive Class, con el respaldo de IBM,así como el IBM badge Data Science Foundations que podras colocar en tu CV o compartir en redes sociales como Facebook, Twitter y LinkedIN; recomendamos sobre manera este curso, ya que te permitira obtener una visión más amplia de lo que es la ciencia de datos (Data Science) y sus herramientas.






El siguiente vídeo muestra como obtener la certificación Introduction to Data Science.






domingo, 4 de octubre de 2020

Instalación del Lenguaje de Programación R 4.0.2

 El siguiente artículo muestra el paso a paso sobre el proceso de cómo instalar el lenguaje de programación R, en su última versión 4.0.2 para Windows 10, navegaremos por el CRAN (The Comprenhensive R Archive Network) la web que contiene el material, espejos (Mirrors) e instaladores relacionados a R.

En el CRAN (https://cran.r-project.org/) nos dirigimos hacia el enlace Download R for Windows, este nos enviara hacia la sección R for Windows, donde haremos click en enlace rotulado como base para instalar R for primera vez para equipos corriendo bajo Windows 10 de 32 o 64 bits, finalmente click sobre el enlace Download R 4.0.2 For Windows para descargar el instalador que nos permitirá instalar el lenguaje de programación R en nuestro equipo.

 En la página principal del CRAN encontraremos el link Download R for Windows

 



base - Install R for the first time

Download R 4.0.2 for Windows








Se procedera a descargar el instalador del lenguaje de programación R (R-4.0.2-win) y comenzaremos con la instalación como lo muestran las siguientes imágenes:

Seleccionamos el idioma al ejecutar el instalador












Licencia Pública General (GPL)















Creación del la carpeta de instalación
















Selección de componentes a instalar















Seleccionamos la opción por defecto (default) 















Se procede a la instalación del lenguaje de programación R















Finalmente terminamos con la instalación pudiendo acceder al R Gui



El siguiente vídeo muestra como instalar el lenguaje de programación R





domingo, 30 de agosto de 2020

Personalizar resultados en la consola de comandos en R | Crear funciones en RStudio

 El siguiente artículo muestra cómo crear funciones personalizadas en el lenguaje de programación R, haciendo que el resultado final que obtenemos en la consola de comandos de R pueda ser personalizado, mostrando no sólo el resultado de la ejecución de la función, sino que se muestren los mensajes previamente configurado por el usuario, como muestra la siguiente imagen.


Procedemos a crear la función incremento_porcentual, haciendo uso de la función function(), definiendo tres variables (var_001,var_002 y var_003) las cuales contendran la cantidad que se desea incrementar,el porcentaje establecido y la operación central de la función respectivamente. El resultado de la ejecución puede ser redondeada a dos digitos haciendo uso de la función round() como se aprecia en la siguiente imagen.











Procedemos a ejecutar la función incremento_porcentual(1890,2.1), donde 1890 es la cantidad a incrementar, mientras que 2.1 es el porcentaje dado, pero como pueden apreciar el resultado final es sólo una cantidad, no tenemos ninguna personalización, ningún mensaje que nos de mayor información sobre el resultado, para cambiar esta situación haremos uso de la función paste() a la cual agregaremos el mensaje que queremos que se muestre luego de la ejecución de la función, paste("El incrementar",var_001,"en",var_002,"% da como resultado",var_003)




Esperamos que la nota sea de utilidad, y seguros que usaran las líneas de código mostradas para personalizar sus resultados al ejecutar sus función en el lenguaje de programación R.


El siguiente vídeo muestra como personalizar resultados en la consola de comandos de RStudio.




viernes, 19 de junio de 2020

ggplot2 para crear un grafico de barras en RStudio

ggplot2 es un paquete creado para el lenguaje de programación R que permite la visualización de datos mediante la creación de gráficos estadísticos profesionales, en este artículo te mostraremos cómo hacer uso de ggplot2 creando un diagrama de barras (Bar Chart) en el entorno de desarrollo RStudio.



Creando un diagrama de barras con ggplot2

A continuación te mostraremos como hacer uso del paquete ggplot2 en el entorno de desarrollo RStudio, para crear un gráfico de barras (Bar Chart), haremos uso del data set mtcars, que ya viene precargado cuando instalamos el lenguaje de programación R.


Procedemos activar el paquete ggplot2 y el data set mtcars, haciendo uso de las funciones library() y attach() respectivamente.





Procedemos a visualizar los registros contenidos en el data set mtcars, haciendo uso de la función View(), para crear el diagrama de barras nos enfocaremos en la variable cyl y los registros que esta almacena.












Continuamos, creando la variable x indicando que esta recibira los registros de la variable cyl (mtcars$cyl), para luego crear la variable color donde asignaremos un vector para establecer los colores de las barras del gráfico, "blue","orange","purple".










Finalmente, ejecutamos las distintas sentencias y comandos relacionados al paquete ggplot2 para crear el diagrama de barras, las cuales explicamos a continuación:









ggplot(mtcars,aes(mtcars$cyl)) 


Indica que se tomara los registros del data set mtcars,aes permite enfocarnos sólo en los datos de la variable cyl
geom_bar(fill=color) 


Permite generar el gráfico de barras, la sentencia fill,asociada a la variable color asigna un color en especifico a cada barra.


labs(title = "Número de cilindros", xlabs = "Cilindros", ylabs="Frecuencias") 
Permite establecer el título principal del gráfico de barras, y los títulos para el eje horizontal y vertical.


 theme_dark()
 Nos permite asignar un color de fondo al gráfico de barras.


Obtenemos como resultado final el siguiente diagrama de barras creado con el paquete ggplot2

























El siguiente vídeo muestra como crear un gráfico de barras en RStudio, mediante el paquete ggplot2. Minuto 5:13




miércoles, 17 de junio de 2020

Crear diagrama de barras en RStudio

El diagrama de barras (Bar chart), llamado también gráfico de barras, es un gráfico estadístico que nos permite representar de manera gráfica la distribución de frecuencias de variables cualitativas y cuantitativas discretas, el lenguaje de programación R cuenta con distintas opciones para presentar dicho gráfico, desde herramientas propias del sistema, hasta paquetes especializados como ggplot2, en este artículo cubriremos el uso de la función Barplot() .


Función Barplot() para crear gráfico de barras


A continución mostraremos el uso de función Barplot() para la creación de un gráfico de barras, haremos uso del dataset mtcars, que ya viene preinstalado cuando instalamos el lenguaje de programación R.
Procedemos a cargar el dataset mtcars, haciendo uso de la función attach().










Podemos visualizar los registros contenidos en mtcars, haciendo uso de la función View(), nos enfocaremos en la variable cyl para la creación del gráfico de barras.








Al hacer uso de la función table() crearemos una tabla de distribución de frecuencias, asignaremos la ejecución de dicho función a la variable x.



  





La primera línea 4 6 8 muestra las observaciones estadísticas, mientras que la segunda línea 11 7 13 es el número de repeticiones.










Para asignar color a las barras del gráfico, procedemos a crear un vector con la función c() estableciendo 3 colores "blue","orange","purple".








Ejecutamos la función Barplot() para la creación del diagrama de barras.


barplot(x, xlab = "Cilindros", ylab="Frecuencias", col= color, main = "Número de Cilindros")


x = variable con los registros de la variable cyl


xlab = permite asignar un rotulo al eje horizontal


ylab = permite asignar un rotulo al eje vertical


col = asignamos colores a las barras


main = título principal del gráfico de barras


Generando el siguiente gráfico de barras




El siguiente vídeo muestra como crear un diagrama de barras en RStudio