viernes, 19 de junio de 2020

ggplot2 para crear un grafico de barras en RStudio

ggplot2 es un paquete creado para el lenguaje de programación R que permite la visualización de datos mediante la creación de gráficos estadísticos profesionales, en este artículo te mostraremos cómo hacer uso de ggplot2 creando un diagrama de barras (Bar Chart) en el entorno de desarrollo RStudio.



Creando un diagrama de barras con ggplot2

A continuación te mostraremos como hacer uso del paquete ggplot2 en el entorno de desarrollo RStudio, para crear un gráfico de barras (Bar Chart), haremos uso del data set mtcars, que ya viene precargado cuando instalamos el lenguaje de programación R.


Procedemos activar el paquete ggplot2 y el data set mtcars, haciendo uso de las funciones library() y attach() respectivamente.





Procedemos a visualizar los registros contenidos en el data set mtcars, haciendo uso de la función View(), para crear el diagrama de barras nos enfocaremos en la variable cyl y los registros que esta almacena.












Continuamos, creando la variable x indicando que esta recibira los registros de la variable cyl (mtcars$cyl), para luego crear la variable color donde asignaremos un vector para establecer los colores de las barras del gráfico, "blue","orange","purple".










Finalmente, ejecutamos las distintas sentencias y comandos relacionados al paquete ggplot2 para crear el diagrama de barras, las cuales explicamos a continuación:









ggplot(mtcars,aes(mtcars$cyl)) 


Indica que se tomara los registros del data set mtcars,aes permite enfocarnos sólo en los datos de la variable cyl
geom_bar(fill=color) 


Permite generar el gráfico de barras, la sentencia fill,asociada a la variable color asigna un color en especifico a cada barra.


labs(title = "Número de cilindros", xlabs = "Cilindros", ylabs="Frecuencias") 
Permite establecer el título principal del gráfico de barras, y los títulos para el eje horizontal y vertical.


 theme_dark()
 Nos permite asignar un color de fondo al gráfico de barras.


Obtenemos como resultado final el siguiente diagrama de barras creado con el paquete ggplot2

























El siguiente vídeo muestra como crear un gráfico de barras en RStudio, mediante el paquete ggplot2. Minuto 5:13




jueves, 18 de junio de 2020

Importar registros desde MySQL a RStudio

ODBC (Open DataBase Connetivity) permite al usuario acceder a distintas y diferentes sistemas de gestion de base de datos (SGBD) como SQL Server, MySQL, PostgreSQL entre otros, desde cualquier aplicación, para este artículo haremos uso del sistema operativo Windows 10, nuestros lenguaje de programación favorito R y su entorno de desarrollo RStudio y un paquete (package) muy particualar RODBC




RODBC para importar registros mediante una conexión ODBC

El paquete RODBC nos permite establecer una conexón ODBC entre el lenguaje de programación R y Bases de datos relacionales como SQL Server, Oracle, MySQL entre ortas  para poder importar registros hacia el hacia el área de edición de RStudio.

A continuación te mostraremos como establecer una conexión ODBC entre el gestor de base de datos MySQL y RStudio para poder importar registros, trabajaremos con la herramienta ODBC de 64 bits de Windows 10.


Activaremos el paquete RODBC, mediante el la función library()










Luego procedemos activar la herramienta Origenes de Datos ODBC (64 bits) para poder crear la conexión ODBC.















Aparecera la siguiente ventana donde seleccionaremos el controlador MySQL ODBC 8.0 ANSI Driver para poder crear el origen de datos.






















Luego procederemos a configurar el origen de datos estableciendo el Data Source como "test_odbc", el usurio para MySQL por lo general es root, ingresamos el password respectivo y seleccionamos la base de datos desde donde importaremos los registros.





En el área de edición de RStudio, ya habiendo activado el paquete RODBC, haremos uso de dos comandos en especifico odbcConnect y sqlQuery.


odbcConnect permite configurar el origen de datos, "test_odbc", a través de uid señalamos el super usuario de mysql (root), pwd nos permite ingresar el password para acceder a la base de datos.


sqlQuery nos permite ejecutar sentencias SQL para visualizar los registros contenidos en las tablas de la base de datos en MySQL.









Finalmente, visualizamos los registros importados mediante el comando View()


















El siguiente vídeo muestra como crear una conexión ODBC entre MySQL y RStudio





miércoles, 17 de junio de 2020

Crear diagrama de barras en RStudio

El diagrama de barras (Bar chart), llamado también gráfico de barras, es un gráfico estadístico que nos permite representar de manera gráfica la distribución de frecuencias de variables cualitativas y cuantitativas discretas, el lenguaje de programación R cuenta con distintas opciones para presentar dicho gráfico, desde herramientas propias del sistema, hasta paquetes especializados como ggplot2, en este artículo cubriremos el uso de la función Barplot() .


Función Barplot() para crear gráfico de barras


A continución mostraremos el uso de función Barplot() para la creación de un gráfico de barras, haremos uso del dataset mtcars, que ya viene preinstalado cuando instalamos el lenguaje de programación R.
Procedemos a cargar el dataset mtcars, haciendo uso de la función attach().










Podemos visualizar los registros contenidos en mtcars, haciendo uso de la función View(), nos enfocaremos en la variable cyl para la creación del gráfico de barras.








Al hacer uso de la función table() crearemos una tabla de distribución de frecuencias, asignaremos la ejecución de dicho función a la variable x.



  





La primera línea 4 6 8 muestra las observaciones estadísticas, mientras que la segunda línea 11 7 13 es el número de repeticiones.










Para asignar color a las barras del gráfico, procedemos a crear un vector con la función c() estableciendo 3 colores "blue","orange","purple".








Ejecutamos la función Barplot() para la creación del diagrama de barras.


barplot(x, xlab = "Cilindros", ylab="Frecuencias", col= color, main = "Número de Cilindros")


x = variable con los registros de la variable cyl


xlab = permite asignar un rotulo al eje horizontal


ylab = permite asignar un rotulo al eje vertical


col = asignamos colores a las barras


main = título principal del gráfico de barras


Generando el siguiente gráfico de barras




El siguiente vídeo muestra como crear un diagrama de barras en RStudio






Creando funciones personalizadas en R

La creación de funciones personalizadas dentro de cualquier aplicación o lenguaje de programación permite al usuario crear sus propias UDF (User Define Functions) funciones definidas por el usuario, el lenguaje de programación R cuenta con cientos de sus propias funciones (R base) y al mismo tiempo permite la creación de tus propias funciones, el siguiente artículo muestra cómo hacer uso del comando function() para la creación de una función relacionada al incremento porcentual.


El uso de function() para crear tus propias funciones


El lenguaje de programación R permiten la creación de funciones personalizadas que se ajusten a tus necesidades, permitiendo incrementar las funcionalidades del entorno de desarrollo de R, te mostraremos como hacer uso de las funciones function() y paste() que nos permitiran crear una función y personalizar la respuesta que muestra el lenguaje R en la consola, al momento de ejecutarla.



Incremento_porcentual()


Llamaremos a nuestra función incremento_porcentual(), esta función en particular permite calcular el incremento de una cantidad en un porcentaje en específico, establecermos el nombre de la función, para luego pasar a designar a las variables (x,y) que recibiran los datos ingresados por el usuario.
"x" recibira los datos relacionados a la cantidad, mientras que "y" el porcentaje al que se incrementara.









Luego procedemos a crear variables que recibiran los datos ingresados por el usuario, a las cuales llamaremos result1 y result2, la variable result3 es la que almacenara el resultado de la operación de incremento porcentual, la cual se obtiene mediante la operación x + x * y/100, para luego hacer uso de la función round() para redondear el resultado a dos decimales.


Finlamente hacemos uso de la función paste(), la cual nos permite configurar la salida de resultados de la variable result3.













La función paste() permite personalizar la salida de resultados, tenemos que diferenciar entre el texto que aparecera en la consola, el cual se define mediante comillas dobles y las variables, ambas deben ser separadas por comas, como lo muestra el siguente código:

paste("El incrementar",result1,"en",result2,"% da como resultado",result3).








Terminamos con la ejecución de la función incremento_porcentual(3456,1.4), veremos en la consola como el resultado usual que hubieramos obtenido del lenguaje, cambia por una respuesta personalizada.













El siguiente vídeo muestra como crear una función personalizada en RStudio paso a paso.



martes, 16 de junio de 2020

Paquete readxl para importar registros de Excel a RStudio

Al dar mis primeros pasos en el mundo del lenguaje de programación R, uno de los primeros paquetes (packages) que aparecieron en mi camino fue readxl, en su versión 1.3.1 nos permite leer archivos de Excel (Read Excel files), en este artículo te mostraremos como hacer uso de una herramienta básica, pero al mismo tiempo últil y poderosa.



Paquete readxl

El paquete readxl  nos permite importar registros desde archivos de Microsoft Excel con  extensión xlsx y xls, a continuación te mostramos como instalar y trabajar con dicho paquete, en RStudio.



Instalando readxl

Procedemos a usar la función install.packages() en el área de edición de RStudio para proceder a instalar el paquete readxl.








Luego activamos al paquete mediante la función library() para poder trabajar con las distintas funciones que nos propociona el paquete.





Procedemos a ejecutar la siguiente línea de código R, para hacer  uso del paquete readxl, asignando la correspondiente variable, indicando la ruta de donde se encuentra el archivo de Excel a importar. Para luego proceder a utilizar la función View() y poder visualizar los registros importados a RStudio.






Mostrando los registros importados mediante la función View()





Descarga el Dataset de Excel para replicar lo mostrado en el artículo: https://bit.ly/30V4aR3

El siguiente vídeo muestra como hacer uso del paquete readxl, encontraras las instrucciones a partir del minuto 4:32