jueves, 25 de junio de 2020

Trabajando con distintas versiones de R en RStudio

Al trabajar con el lenguaje de programación R, podemos llegar a situaciones en que para ejecutar determinado paquete debemos usar una versión en especifico de R, en este artículo te mostraremos un truco que involucra a la tecla CTRL (control) que permite cambiar entre versiones de R antes de ejecutar el entorno de desarrollo RStudio.


El entorno en que estamos trabajando es Windows 10 y tenemos instaladas dos versiones del lenguaje de programación R, la 3.6.0 y 4.0.0 y necesitamos ejecutar un paquete en especifico que sólo se activa con determinada versión, entra en el escenario la tecla CTRL que al mantenerla presionada en todo momento antes de activar RStudio nos mostrara antes de ejecutar la aplicación, nos mostrara una ventana que nos permitira escoger entre las distintas versiones de R que tenemos instaladas en nuestros equipos.

















Podras escoger entre las distintas versiones de R instaladas en tu sistema.
























Finalmente, tenemos que señalar que la versión de R que eligas se mantendra activa,hasta que no realices la operación contraria y vuelvas a elegir la versión por defecto instalada en tu equipo.


El siguiente vídeo te muestra como cambiar entre distintas versiones de R.




martes, 23 de junio de 2020

Importar registros desde Stata a RStudio

El software estadístico Stata es uno de los más usados en el ambito de la investigación científica, en esta edición te mostraremos como importar registros desde Stata hacia el entorno de desarrollo RStudio, haciendo uso del paquete foreign, también resolveremos uno de los principales problemas en relación a la versión de Stata con que se deben guardar los archivos con extensión *.dta para no tener conflictos al momento de importar registros a R.






Procedemos a cargar el paquete foreign haciendo uso de la función library()








A continuación mostraremos los registros a importar a RStudio, contenidos en el archivo Stata_data_001.dta, que fue creado usando la versión de Stata 15.1






























Crearemos la variable tabla_Stata, que contendra los registros almacenados en el archivo Stata_data_001.dta (versión 15.1) para ser importados en RStudio, procedemos a la creación del objeto y obtenemos el siguiente  mensaje de de error not a Stata version 5-12 .dta file", foreign (versión 0.8) como paquete es muy últil pero en relación a importar archivos de Stata sólo trabaja con las versiones 5-12 con extensión .dta.







Para poder salvar este escoyo, procedemos a guardar nuestros registros bajo el formato de la versión 12 de Stata.






















Finalmente, creamos el objeto tabla_Stata, recordar guarda el archivo bajo la versión 12, y terminamos visualizando los registros importados a RStudio, haciendo uso de la función View().























Descargar el archivo de Stata: https://bit.ly/3hSb4fL 

El siguiente vídeo muestra como importar registros desde Stata a RStudio.





lunes, 22 de junio de 2020

Importar registros desde SPSS a RStudio

La primera vez que utilice el programa SPSS (Statistical Package for Social Science) fue en la universidad; en el curso de Estadística Aplicada, SPSS tiene más de 50 años en el mercado su impacto y uso por la comunidad académica es indiscutible, en este artículo te mostraremos como importar registros desde SPSS hacia el área de trabajo de RStudio haciendo uso del entorno de desarrollo RStudio. 






El importar registros desde distintas fuentes es una de las tareas básicas que aprendemos cuando damos nuestros primeros pasos en el mundo del lenguaje de programación R, en este artículo te mostraremos como hacer uso del paquete haven para importar registros desde el software estadístico SPSS.


Cabe señalar que el paquete haven en su versión 2.2.0 nos importar y exportar archivos de SPSS, Stata y SAS en el lenguaje de programación R y su entorno de desarrollo RStudio.
Procedemos a activar el paquete haciendo uso de la función library()







 

Antes de continuar, procedemos a visualizar las observaciones que vamos a importar desde SPSS, estamos trabajando con 20 registros, dos variables, Age (variable cuantitaitva), Sex (variable cualitativa).







Procedemos a crear la variable tabla_spss que contendra los registros que importaremos desde SPSS, para luego hacer uso de la función View() y poder visualizar los datos contenidos en el objeto.






Descargar el archivo de SPSS mostrado en el artículo: https://bit.ly/2AWRFK1


El siguiente vídeo muestra como importar registros desde SPSS a RStudio, usando el paquete haven a partir del minuto 5:15





sábado, 20 de junio de 2020

Crear Histograma de frecuencias en RStudio

La Estadística como ciencia y rama de las matemáticas cuenta con un ejército de gráficos que permiten la representar los registros con los que trabajamos, el Histograma es una herramienta gráfica que nos permite mostrar la distribución de frecuencias de una variable cuantitativa continua, en este artículo te mostraremos como hacer uso de la función hist() para la creación del gráfico estadístico.


Función hist() para crear un histograma


La función hist() permite crear un histograma en el lenguaje de programación R, haremos uso del entorno de desarrollo RStudio para crear el gráfico estadístico.


La imagen a continuación nos muestra el data set que utilizaremos para la creación del Histograma, es un archivo de Microsoft Excel que contiene 52 registros relacionados a montos de facturas, haremos uso del paquete readxl para importar los registros a RStudio.




























Activamos el paquete readxl, mediante la función library(), para luego importar los registros desde el archivo de Excel facturas.xlsx, asignando la ejecución a la variable facturas, para luego visualizar la data importada con la función View().






Finalizamos, con la ejecución de la función hist(), a continuación explicamos cada unos de los elementos que nos permiten crear el Histograma.










facturas$monto_facturas  
Toma los registros de la variable monto_facturas 

xlab 

"Montos" (Asigna un título al eje horizontal)

ylab 

"Frecuencias" (Asigna un título al eje vertical)

main

"Montos de facturas" (Asigna el título principal del Histograma)

col 
"purple" (Establece el color purpura para las barras del Histograma)



Terminamos con la creación del siguiente Histograma de frecuencias.






Descarga el archivo de Excel para crear el Histograma: https://bit.ly/37N5czO

El siguiente vídeo muestra como crear un Histograma en RStudio



viernes, 19 de junio de 2020

ggplot2 para crear un grafico de barras en RStudio

ggplot2 es un paquete creado para el lenguaje de programación R que permite la visualización de datos mediante la creación de gráficos estadísticos profesionales, en este artículo te mostraremos cómo hacer uso de ggplot2 creando un diagrama de barras (Bar Chart) en el entorno de desarrollo RStudio.



Creando un diagrama de barras con ggplot2

A continuación te mostraremos como hacer uso del paquete ggplot2 en el entorno de desarrollo RStudio, para crear un gráfico de barras (Bar Chart), haremos uso del data set mtcars, que ya viene precargado cuando instalamos el lenguaje de programación R.


Procedemos activar el paquete ggplot2 y el data set mtcars, haciendo uso de las funciones library() y attach() respectivamente.





Procedemos a visualizar los registros contenidos en el data set mtcars, haciendo uso de la función View(), para crear el diagrama de barras nos enfocaremos en la variable cyl y los registros que esta almacena.












Continuamos, creando la variable x indicando que esta recibira los registros de la variable cyl (mtcars$cyl), para luego crear la variable color donde asignaremos un vector para establecer los colores de las barras del gráfico, "blue","orange","purple".










Finalmente, ejecutamos las distintas sentencias y comandos relacionados al paquete ggplot2 para crear el diagrama de barras, las cuales explicamos a continuación:









ggplot(mtcars,aes(mtcars$cyl)) 


Indica que se tomara los registros del data set mtcars,aes permite enfocarnos sólo en los datos de la variable cyl
geom_bar(fill=color) 


Permite generar el gráfico de barras, la sentencia fill,asociada a la variable color asigna un color en especifico a cada barra.


labs(title = "Número de cilindros", xlabs = "Cilindros", ylabs="Frecuencias") 
Permite establecer el título principal del gráfico de barras, y los títulos para el eje horizontal y vertical.


 theme_dark()
 Nos permite asignar un color de fondo al gráfico de barras.


Obtenemos como resultado final el siguiente diagrama de barras creado con el paquete ggplot2

























El siguiente vídeo muestra como crear un gráfico de barras en RStudio, mediante el paquete ggplot2. Minuto 5:13




jueves, 18 de junio de 2020

Importar registros desde MySQL a RStudio

ODBC (Open DataBase Connetivity) permite al usuario acceder a distintas y diferentes sistemas de gestion de base de datos (SGBD) como SQL Server, MySQL, PostgreSQL entre otros, desde cualquier aplicación, para este artículo haremos uso del sistema operativo Windows 10, nuestros lenguaje de programación favorito R y su entorno de desarrollo RStudio y un paquete (package) muy particualar RODBC




RODBC para importar registros mediante una conexión ODBC

El paquete RODBC nos permite establecer una conexón ODBC entre el lenguaje de programación R y Bases de datos relacionales como SQL Server, Oracle, MySQL entre ortas  para poder importar registros hacia el hacia el área de edición de RStudio.

A continuación te mostraremos como establecer una conexión ODBC entre el gestor de base de datos MySQL y RStudio para poder importar registros, trabajaremos con la herramienta ODBC de 64 bits de Windows 10.


Activaremos el paquete RODBC, mediante el la función library()










Luego procedemos activar la herramienta Origenes de Datos ODBC (64 bits) para poder crear la conexión ODBC.















Aparecera la siguiente ventana donde seleccionaremos el controlador MySQL ODBC 8.0 ANSI Driver para poder crear el origen de datos.






















Luego procederemos a configurar el origen de datos estableciendo el Data Source como "test_odbc", el usurio para MySQL por lo general es root, ingresamos el password respectivo y seleccionamos la base de datos desde donde importaremos los registros.





En el área de edición de RStudio, ya habiendo activado el paquete RODBC, haremos uso de dos comandos en especifico odbcConnect y sqlQuery.


odbcConnect permite configurar el origen de datos, "test_odbc", a través de uid señalamos el super usuario de mysql (root), pwd nos permite ingresar el password para acceder a la base de datos.


sqlQuery nos permite ejecutar sentencias SQL para visualizar los registros contenidos en las tablas de la base de datos en MySQL.









Finalmente, visualizamos los registros importados mediante el comando View()


















El siguiente vídeo muestra como crear una conexión ODBC entre MySQL y RStudio





miércoles, 17 de junio de 2020

Crear diagrama de barras en RStudio

El diagrama de barras (Bar chart), llamado también gráfico de barras, es un gráfico estadístico que nos permite representar de manera gráfica la distribución de frecuencias de variables cualitativas y cuantitativas discretas, el lenguaje de programación R cuenta con distintas opciones para presentar dicho gráfico, desde herramientas propias del sistema, hasta paquetes especializados como ggplot2, en este artículo cubriremos el uso de la función Barplot() .


Función Barplot() para crear gráfico de barras


A continución mostraremos el uso de función Barplot() para la creación de un gráfico de barras, haremos uso del dataset mtcars, que ya viene preinstalado cuando instalamos el lenguaje de programación R.
Procedemos a cargar el dataset mtcars, haciendo uso de la función attach().










Podemos visualizar los registros contenidos en mtcars, haciendo uso de la función View(), nos enfocaremos en la variable cyl para la creación del gráfico de barras.








Al hacer uso de la función table() crearemos una tabla de distribución de frecuencias, asignaremos la ejecución de dicho función a la variable x.



  





La primera línea 4 6 8 muestra las observaciones estadísticas, mientras que la segunda línea 11 7 13 es el número de repeticiones.










Para asignar color a las barras del gráfico, procedemos a crear un vector con la función c() estableciendo 3 colores "blue","orange","purple".








Ejecutamos la función Barplot() para la creación del diagrama de barras.


barplot(x, xlab = "Cilindros", ylab="Frecuencias", col= color, main = "Número de Cilindros")


x = variable con los registros de la variable cyl


xlab = permite asignar un rotulo al eje horizontal


ylab = permite asignar un rotulo al eje vertical


col = asignamos colores a las barras


main = título principal del gráfico de barras


Generando el siguiente gráfico de barras




El siguiente vídeo muestra como crear un diagrama de barras en RStudio






Creando funciones personalizadas en R

La creación de funciones personalizadas dentro de cualquier aplicación o lenguaje de programación permite al usuario crear sus propias UDF (User Define Functions) funciones definidas por el usuario, el lenguaje de programación R cuenta con cientos de sus propias funciones (R base) y al mismo tiempo permite la creación de tus propias funciones, el siguiente artículo muestra cómo hacer uso del comando function() para la creación de una función relacionada al incremento porcentual.


El uso de function() para crear tus propias funciones


El lenguaje de programación R permiten la creación de funciones personalizadas que se ajusten a tus necesidades, permitiendo incrementar las funcionalidades del entorno de desarrollo de R, te mostraremos como hacer uso de las funciones function() y paste() que nos permitiran crear una función y personalizar la respuesta que muestra el lenguaje R en la consola, al momento de ejecutarla.



Incremento_porcentual()


Llamaremos a nuestra función incremento_porcentual(), esta función en particular permite calcular el incremento de una cantidad en un porcentaje en específico, establecermos el nombre de la función, para luego pasar a designar a las variables (x,y) que recibiran los datos ingresados por el usuario.
"x" recibira los datos relacionados a la cantidad, mientras que "y" el porcentaje al que se incrementara.









Luego procedemos a crear variables que recibiran los datos ingresados por el usuario, a las cuales llamaremos result1 y result2, la variable result3 es la que almacenara el resultado de la operación de incremento porcentual, la cual se obtiene mediante la operación x + x * y/100, para luego hacer uso de la función round() para redondear el resultado a dos decimales.


Finlamente hacemos uso de la función paste(), la cual nos permite configurar la salida de resultados de la variable result3.













La función paste() permite personalizar la salida de resultados, tenemos que diferenciar entre el texto que aparecera en la consola, el cual se define mediante comillas dobles y las variables, ambas deben ser separadas por comas, como lo muestra el siguente código:

paste("El incrementar",result1,"en",result2,"% da como resultado",result3).








Terminamos con la ejecución de la función incremento_porcentual(3456,1.4), veremos en la consola como el resultado usual que hubieramos obtenido del lenguaje, cambia por una respuesta personalizada.













El siguiente vídeo muestra como crear una función personalizada en RStudio paso a paso.



martes, 16 de junio de 2020

Paquete readxl para importar registros de Excel a RStudio

Al dar mis primeros pasos en el mundo del lenguaje de programación R, uno de los primeros paquetes (packages) que aparecieron en mi camino fue readxl, en su versión 1.3.1 nos permite leer archivos de Excel (Read Excel files), en este artículo te mostraremos como hacer uso de una herramienta básica, pero al mismo tiempo últil y poderosa.



Paquete readxl

El paquete readxl  nos permite importar registros desde archivos de Microsoft Excel con  extensión xlsx y xls, a continuación te mostramos como instalar y trabajar con dicho paquete, en RStudio.



Instalando readxl

Procedemos a usar la función install.packages() en el área de edición de RStudio para proceder a instalar el paquete readxl.








Luego activamos al paquete mediante la función library() para poder trabajar con las distintas funciones que nos propociona el paquete.





Procedemos a ejecutar la siguiente línea de código R, para hacer  uso del paquete readxl, asignando la correspondiente variable, indicando la ruta de donde se encuentra el archivo de Excel a importar. Para luego proceder a utilizar la función View() y poder visualizar los registros importados a RStudio.






Mostrando los registros importados mediante la función View()





Descarga el Dataset de Excel para replicar lo mostrado en el artículo: https://bit.ly/30V4aR3

El siguiente vídeo muestra como hacer uso del paquete readxl, encontraras las instrucciones a partir del minuto 4:32