jueves, 18 de junio de 2020

Importar registros desde MySQL a RStudio

ODBC (Open DataBase Connetivity) permite al usuario acceder a distintas y diferentes sistemas de gestion de base de datos (SGBD) como SQL Server, MySQL, PostgreSQL entre otros, desde cualquier aplicación, para este artículo haremos uso del sistema operativo Windows 10, nuestros lenguaje de programación favorito R y su entorno de desarrollo RStudio y un paquete (package) muy particualar RODBC




RODBC para importar registros mediante una conexión ODBC

El paquete RODBC nos permite establecer una conexón ODBC entre el lenguaje de programación R y Bases de datos relacionales como SQL Server, Oracle, MySQL entre ortas  para poder importar registros hacia el hacia el área de edición de RStudio.

A continuación te mostraremos como establecer una conexión ODBC entre el gestor de base de datos MySQL y RStudio para poder importar registros, trabajaremos con la herramienta ODBC de 64 bits de Windows 10.


Activaremos el paquete RODBC, mediante el la función library()










Luego procedemos activar la herramienta Origenes de Datos ODBC (64 bits) para poder crear la conexión ODBC.















Aparecera la siguiente ventana donde seleccionaremos el controlador MySQL ODBC 8.0 ANSI Driver para poder crear el origen de datos.






















Luego procederemos a configurar el origen de datos estableciendo el Data Source como "test_odbc", el usurio para MySQL por lo general es root, ingresamos el password respectivo y seleccionamos la base de datos desde donde importaremos los registros.





En el área de edición de RStudio, ya habiendo activado el paquete RODBC, haremos uso de dos comandos en especifico odbcConnect y sqlQuery.


odbcConnect permite configurar el origen de datos, "test_odbc", a través de uid señalamos el super usuario de mysql (root), pwd nos permite ingresar el password para acceder a la base de datos.


sqlQuery nos permite ejecutar sentencias SQL para visualizar los registros contenidos en las tablas de la base de datos en MySQL.









Finalmente, visualizamos los registros importados mediante el comando View()


















El siguiente vídeo muestra como crear una conexión ODBC entre MySQL y RStudio





miércoles, 17 de junio de 2020

Crear diagrama de barras en RStudio

El diagrama de barras (Bar chart), llamado también gráfico de barras, es un gráfico estadístico que nos permite representar de manera gráfica la distribución de frecuencias de variables cualitativas y cuantitativas discretas, el lenguaje de programación R cuenta con distintas opciones para presentar dicho gráfico, desde herramientas propias del sistema, hasta paquetes especializados como ggplot2, en este artículo cubriremos el uso de la función Barplot() .


Función Barplot() para crear gráfico de barras


A continución mostraremos el uso de función Barplot() para la creación de un gráfico de barras, haremos uso del dataset mtcars, que ya viene preinstalado cuando instalamos el lenguaje de programación R.
Procedemos a cargar el dataset mtcars, haciendo uso de la función attach().










Podemos visualizar los registros contenidos en mtcars, haciendo uso de la función View(), nos enfocaremos en la variable cyl para la creación del gráfico de barras.








Al hacer uso de la función table() crearemos una tabla de distribución de frecuencias, asignaremos la ejecución de dicho función a la variable x.



  





La primera línea 4 6 8 muestra las observaciones estadísticas, mientras que la segunda línea 11 7 13 es el número de repeticiones.










Para asignar color a las barras del gráfico, procedemos a crear un vector con la función c() estableciendo 3 colores "blue","orange","purple".








Ejecutamos la función Barplot() para la creación del diagrama de barras.


barplot(x, xlab = "Cilindros", ylab="Frecuencias", col= color, main = "Número de Cilindros")


x = variable con los registros de la variable cyl


xlab = permite asignar un rotulo al eje horizontal


ylab = permite asignar un rotulo al eje vertical


col = asignamos colores a las barras


main = título principal del gráfico de barras


Generando el siguiente gráfico de barras




El siguiente vídeo muestra como crear un diagrama de barras en RStudio






Creando funciones personalizadas en R

La creación de funciones personalizadas dentro de cualquier aplicación o lenguaje de programación permite al usuario crear sus propias UDF (User Define Functions) funciones definidas por el usuario, el lenguaje de programación R cuenta con cientos de sus propias funciones (R base) y al mismo tiempo permite la creación de tus propias funciones, el siguiente artículo muestra cómo hacer uso del comando function() para la creación de una función relacionada al incremento porcentual.


El uso de function() para crear tus propias funciones


El lenguaje de programación R permiten la creación de funciones personalizadas que se ajusten a tus necesidades, permitiendo incrementar las funcionalidades del entorno de desarrollo de R, te mostraremos como hacer uso de las funciones function() y paste() que nos permitiran crear una función y personalizar la respuesta que muestra el lenguaje R en la consola, al momento de ejecutarla.



Incremento_porcentual()


Llamaremos a nuestra función incremento_porcentual(), esta función en particular permite calcular el incremento de una cantidad en un porcentaje en específico, establecermos el nombre de la función, para luego pasar a designar a las variables (x,y) que recibiran los datos ingresados por el usuario.
"x" recibira los datos relacionados a la cantidad, mientras que "y" el porcentaje al que se incrementara.









Luego procedemos a crear variables que recibiran los datos ingresados por el usuario, a las cuales llamaremos result1 y result2, la variable result3 es la que almacenara el resultado de la operación de incremento porcentual, la cual se obtiene mediante la operación x + x * y/100, para luego hacer uso de la función round() para redondear el resultado a dos decimales.


Finlamente hacemos uso de la función paste(), la cual nos permite configurar la salida de resultados de la variable result3.













La función paste() permite personalizar la salida de resultados, tenemos que diferenciar entre el texto que aparecera en la consola, el cual se define mediante comillas dobles y las variables, ambas deben ser separadas por comas, como lo muestra el siguente código:

paste("El incrementar",result1,"en",result2,"% da como resultado",result3).








Terminamos con la ejecución de la función incremento_porcentual(3456,1.4), veremos en la consola como el resultado usual que hubieramos obtenido del lenguaje, cambia por una respuesta personalizada.













El siguiente vídeo muestra como crear una función personalizada en RStudio paso a paso.



martes, 16 de junio de 2020

Paquete readxl para importar registros de Excel a RStudio

Al dar mis primeros pasos en el mundo del lenguaje de programación R, uno de los primeros paquetes (packages) que aparecieron en mi camino fue readxl, en su versión 1.3.1 nos permite leer archivos de Excel (Read Excel files), en este artículo te mostraremos como hacer uso de una herramienta básica, pero al mismo tiempo últil y poderosa.



Paquete readxl

El paquete readxl  nos permite importar registros desde archivos de Microsoft Excel con  extensión xlsx y xls, a continuación te mostramos como instalar y trabajar con dicho paquete, en RStudio.



Instalando readxl

Procedemos a usar la función install.packages() en el área de edición de RStudio para proceder a instalar el paquete readxl.








Luego activamos al paquete mediante la función library() para poder trabajar con las distintas funciones que nos propociona el paquete.





Procedemos a ejecutar la siguiente línea de código R, para hacer  uso del paquete readxl, asignando la correspondiente variable, indicando la ruta de donde se encuentra el archivo de Excel a importar. Para luego proceder a utilizar la función View() y poder visualizar los registros importados a RStudio.






Mostrando los registros importados mediante la función View()





Descarga el Dataset de Excel para replicar lo mostrado en el artículo: https://bit.ly/30V4aR3

El siguiente vídeo muestra como hacer uso del paquete readxl, encontraras las instrucciones a partir del minuto 4:32


lunes, 15 de junio de 2020

Importar registros desde Excel a RStudio

Una de las funciones básicas dentro del manejo, del uso de todo lenguaje de programación (R, Python, C++) y su entorno de desarrollo (Aptana, NetBeans, Visual Studio, etc.) es la de importar registros desde distintas fuentes, desde distintos origenes, tales como archivos de texto, bases de datos (SQL Server, Oracle, MySQL, entre otros.) y hojas de cálculo; nuestro lenguaje favorito R, no es ajeno a eso, el siguiente artículo muestra como hacer uso de las herramientas (built-in tools) que nos proporciona el entorno de desarrollo (IDE) RStudio para importar registros desde Microsoft Excel (archivos con extensiones xls y xlsx) hacia el área de edición de RStudio para poder gestionar los datos importados de manera fácil y rápida.


Import Dataset

Debemos tener en cuenta, que a pesar de hacer uso de las herramientas (built-in tools) que nos proporciona RStudio para realizar las operaciones de importar registros desde distintas fuentes al área de edición del entorno de desarrollo, en todo momento, cuando ejecutamos alguna acción en la interfaz gráfica, hay paquetes (R packages) especificamente diseñados para el lenguaje de programación R que se están ejecutando.
En la barra de Menu, seleccionas la opción File, para luego hacer click en Import Dataset, esto te mostrara un submenu con distintas opciones, debes elegir la opción From Excel.
La siguiente imagen muestra como hacerlo.





Importando registros de Excel a RStudio


Luego de hacer click en la opción From Excel (Desde Excel), se mostrara una ventana llamada Import Excel Data (Importar registros de Excel) que te permitira navegar por las carpetas donde almacenas tus archivos de Excel (con extesión xls y xlsx), seleccionar dichos archivos y poder previsualizarlos antes de realizar la importación de los registros.
Las opciones claves en la ventana Import Excel Data son Browse, File/URL y Data Preview, el primero te permite seleccionar los archivos Excel que se encuentran en tu equipo o en la nube (dirección URL)
Las siguientes imágenes te muestran dichas opciones y la visualización previa de los registros de Excel


Luego de seleccionar el archivo de Excel, contaras con una vista previa (Data Preview) de los registros a importar, sólo debes hacer click en el boton Import (Importar) para poder tener los registros en el área de edición de RStudio, cabe señalar que este procedimiento funciona tanto para archivos de Excel con extensiones xls y xlsx, para efectos del proceso de importación, debemos señalar que los archivos con extensión xls almacenan información en formato binario, mientras que los archivos con extensión xlsx almacenan información usando XML.






Finalmente, podras visualizar los registros que acabas de importar desde Excel en el área de edición de RStudio, listo para trabajar con ellos, cabe señalar que solo utilizamos la interfaz grafica, RStudio sigue ejecutando las distintas funciones y comandos del lenguaje de programación R, como puedes apreciar en la siguiente imágen, en el área de la consola, se ejecuto el paquete readxl, el cual nos permite sólo leer archivos de Excel (readxl package 1.3.1 - read Excel filesen un próximo artículo te mostraremos como utilizar dicho paquete para importar registros desde Excel a R. 


Click en el enlace para ir al artículo en relación al paquete readxl: https://bit.ly/2zEgJEV






















Descarga el Dataset de Excel para replicar lo mostrado en el artículo: https://bit.ly/30V4aR3

Te comparto el siguiente vídeo que te muestra como realizar el procedimiento de importar registros de Excel a RStudio paso a paso.