Mostrando las entradas con la etiqueta RStudio. Mostrar todas las entradas
Mostrando las entradas con la etiqueta RStudio. Mostrar todas las entradas

domingo, 9 de agosto de 2020

Ejecutando sentencias SQL en RStudio

El uso del paquete SQLDF nos permite ejecutar sentencias SQL sobre  Data Sets precargados o importados al área de edición del entorno de desarrollo RStudio, el siguiente artículo muestra como trabajar con dicho paquete, haremos uso del Data Set mtcars, como modelo para ejecutar las sentencias.


Procedemos a activar el paquete sqldf haciendo uso de la función library() esto también activara paquete adicionales tales como gsubfn, proto y RSQLite como pueden apreciar en las imágenes que mostramos a continuación.














A continuación haremos uso de las siguientes funciones: data() , attach(), View(), éstas funciones nos pemitiran mostrar los Data Sets que ya vienen precargados en RStudio, cargar el data set mtcars que utilizaremos para ejecutar las sentencias SQL y para visualizar los registros contenido en mtcars respectivamente.













La siguiente imagen nos muestra el data set mtcars dentros de los distintos demos preinstalados en el lenguaje de programación R, se utilizo la función data()



















La función View() nos permitira visualizar los registros contenidos en el data set mtcars como se muestra a continuación a través de la siguiente imagen.



















Finalmente, haremos uso del paquete sqldf ejecutandos sentencias SQL sobre el data set mtcars como se muestra en las siguiente imágenes.


Procedemos a crear el objeto all_mtcars <- sqldf("select mpg,cyl from mtcars where cyl >=6") que nos muestra los campos mpg y cyl, bajo la condición de muestre los registros del campo cyl mayores o igual a 6. Siendo el resultado final la imagen que mostramos a continuación.




El siguiente vídeo muestra paso a paso como hacer uso del paquete sqldf y ejecutar sentencias SQL sobre el data set mtcars.




jueves, 25 de junio de 2020

Trabajando con distintas versiones de R en RStudio

Al trabajar con el lenguaje de programación R, podemos llegar a situaciones en que para ejecutar determinado paquete debemos usar una versión en especifico de R, en este artículo te mostraremos un truco que involucra a la tecla CTRL (control) que permite cambiar entre versiones de R antes de ejecutar el entorno de desarrollo RStudio.


El entorno en que estamos trabajando es Windows 10 y tenemos instaladas dos versiones del lenguaje de programación R, la 3.6.0 y 4.0.0 y necesitamos ejecutar un paquete en especifico que sólo se activa con determinada versión, entra en el escenario la tecla CTRL que al mantenerla presionada en todo momento antes de activar RStudio nos mostrara antes de ejecutar la aplicación, nos mostrara una ventana que nos permitira escoger entre las distintas versiones de R que tenemos instaladas en nuestros equipos.

















Podras escoger entre las distintas versiones de R instaladas en tu sistema.
























Finalmente, tenemos que señalar que la versión de R que eligas se mantendra activa,hasta que no realices la operación contraria y vuelvas a elegir la versión por defecto instalada en tu equipo.


El siguiente vídeo te muestra como cambiar entre distintas versiones de R.




sábado, 20 de junio de 2020

Crear Histograma de frecuencias en RStudio

La Estadística como ciencia y rama de las matemáticas cuenta con un ejército de gráficos que permiten la representar los registros con los que trabajamos, el Histograma es una herramienta gráfica que nos permite mostrar la distribución de frecuencias de una variable cuantitativa continua, en este artículo te mostraremos como hacer uso de la función hist() para la creación del gráfico estadístico.


Función hist() para crear un histograma


La función hist() permite crear un histograma en el lenguaje de programación R, haremos uso del entorno de desarrollo RStudio para crear el gráfico estadístico.


La imagen a continuación nos muestra el data set que utilizaremos para la creación del Histograma, es un archivo de Microsoft Excel que contiene 52 registros relacionados a montos de facturas, haremos uso del paquete readxl para importar los registros a RStudio.




























Activamos el paquete readxl, mediante la función library(), para luego importar los registros desde el archivo de Excel facturas.xlsx, asignando la ejecución a la variable facturas, para luego visualizar la data importada con la función View().






Finalizamos, con la ejecución de la función hist(), a continuación explicamos cada unos de los elementos que nos permiten crear el Histograma.










facturas$monto_facturas  
Toma los registros de la variable monto_facturas 

xlab 

"Montos" (Asigna un título al eje horizontal)

ylab 

"Frecuencias" (Asigna un título al eje vertical)

main

"Montos de facturas" (Asigna el título principal del Histograma)

col 
"purple" (Establece el color purpura para las barras del Histograma)



Terminamos con la creación del siguiente Histograma de frecuencias.






Descarga el archivo de Excel para crear el Histograma: https://bit.ly/37N5czO

El siguiente vídeo muestra como crear un Histograma en RStudio



viernes, 19 de junio de 2020

ggplot2 para crear un grafico de barras en RStudio

ggplot2 es un paquete creado para el lenguaje de programación R que permite la visualización de datos mediante la creación de gráficos estadísticos profesionales, en este artículo te mostraremos cómo hacer uso de ggplot2 creando un diagrama de barras (Bar Chart) en el entorno de desarrollo RStudio.



Creando un diagrama de barras con ggplot2

A continuación te mostraremos como hacer uso del paquete ggplot2 en el entorno de desarrollo RStudio, para crear un gráfico de barras (Bar Chart), haremos uso del data set mtcars, que ya viene precargado cuando instalamos el lenguaje de programación R.


Procedemos activar el paquete ggplot2 y el data set mtcars, haciendo uso de las funciones library() y attach() respectivamente.





Procedemos a visualizar los registros contenidos en el data set mtcars, haciendo uso de la función View(), para crear el diagrama de barras nos enfocaremos en la variable cyl y los registros que esta almacena.












Continuamos, creando la variable x indicando que esta recibira los registros de la variable cyl (mtcars$cyl), para luego crear la variable color donde asignaremos un vector para establecer los colores de las barras del gráfico, "blue","orange","purple".










Finalmente, ejecutamos las distintas sentencias y comandos relacionados al paquete ggplot2 para crear el diagrama de barras, las cuales explicamos a continuación:









ggplot(mtcars,aes(mtcars$cyl)) 


Indica que se tomara los registros del data set mtcars,aes permite enfocarnos sólo en los datos de la variable cyl
geom_bar(fill=color) 


Permite generar el gráfico de barras, la sentencia fill,asociada a la variable color asigna un color en especifico a cada barra.


labs(title = "Número de cilindros", xlabs = "Cilindros", ylabs="Frecuencias") 
Permite establecer el título principal del gráfico de barras, y los títulos para el eje horizontal y vertical.


 theme_dark()
 Nos permite asignar un color de fondo al gráfico de barras.


Obtenemos como resultado final el siguiente diagrama de barras creado con el paquete ggplot2

























El siguiente vídeo muestra como crear un gráfico de barras en RStudio, mediante el paquete ggplot2. Minuto 5:13




jueves, 18 de junio de 2020

Importar registros desde MySQL a RStudio

ODBC (Open DataBase Connetivity) permite al usuario acceder a distintas y diferentes sistemas de gestion de base de datos (SGBD) como SQL Server, MySQL, PostgreSQL entre otros, desde cualquier aplicación, para este artículo haremos uso del sistema operativo Windows 10, nuestros lenguaje de programación favorito R y su entorno de desarrollo RStudio y un paquete (package) muy particualar RODBC




RODBC para importar registros mediante una conexión ODBC

El paquete RODBC nos permite establecer una conexón ODBC entre el lenguaje de programación R y Bases de datos relacionales como SQL Server, Oracle, MySQL entre ortas  para poder importar registros hacia el hacia el área de edición de RStudio.

A continuación te mostraremos como establecer una conexión ODBC entre el gestor de base de datos MySQL y RStudio para poder importar registros, trabajaremos con la herramienta ODBC de 64 bits de Windows 10.


Activaremos el paquete RODBC, mediante el la función library()










Luego procedemos activar la herramienta Origenes de Datos ODBC (64 bits) para poder crear la conexión ODBC.















Aparecera la siguiente ventana donde seleccionaremos el controlador MySQL ODBC 8.0 ANSI Driver para poder crear el origen de datos.






















Luego procederemos a configurar el origen de datos estableciendo el Data Source como "test_odbc", el usurio para MySQL por lo general es root, ingresamos el password respectivo y seleccionamos la base de datos desde donde importaremos los registros.





En el área de edición de RStudio, ya habiendo activado el paquete RODBC, haremos uso de dos comandos en especifico odbcConnect y sqlQuery.


odbcConnect permite configurar el origen de datos, "test_odbc", a través de uid señalamos el super usuario de mysql (root), pwd nos permite ingresar el password para acceder a la base de datos.


sqlQuery nos permite ejecutar sentencias SQL para visualizar los registros contenidos en las tablas de la base de datos en MySQL.









Finalmente, visualizamos los registros importados mediante el comando View()


















El siguiente vídeo muestra como crear una conexión ODBC entre MySQL y RStudio





miércoles, 17 de junio de 2020

Crear diagrama de barras en RStudio

El diagrama de barras (Bar chart), llamado también gráfico de barras, es un gráfico estadístico que nos permite representar de manera gráfica la distribución de frecuencias de variables cualitativas y cuantitativas discretas, el lenguaje de programación R cuenta con distintas opciones para presentar dicho gráfico, desde herramientas propias del sistema, hasta paquetes especializados como ggplot2, en este artículo cubriremos el uso de la función Barplot() .


Función Barplot() para crear gráfico de barras


A continución mostraremos el uso de función Barplot() para la creación de un gráfico de barras, haremos uso del dataset mtcars, que ya viene preinstalado cuando instalamos el lenguaje de programación R.
Procedemos a cargar el dataset mtcars, haciendo uso de la función attach().










Podemos visualizar los registros contenidos en mtcars, haciendo uso de la función View(), nos enfocaremos en la variable cyl para la creación del gráfico de barras.








Al hacer uso de la función table() crearemos una tabla de distribución de frecuencias, asignaremos la ejecución de dicho función a la variable x.



  





La primera línea 4 6 8 muestra las observaciones estadísticas, mientras que la segunda línea 11 7 13 es el número de repeticiones.










Para asignar color a las barras del gráfico, procedemos a crear un vector con la función c() estableciendo 3 colores "blue","orange","purple".








Ejecutamos la función Barplot() para la creación del diagrama de barras.


barplot(x, xlab = "Cilindros", ylab="Frecuencias", col= color, main = "Número de Cilindros")


x = variable con los registros de la variable cyl


xlab = permite asignar un rotulo al eje horizontal


ylab = permite asignar un rotulo al eje vertical


col = asignamos colores a las barras


main = título principal del gráfico de barras


Generando el siguiente gráfico de barras




El siguiente vídeo muestra como crear un diagrama de barras en RStudio






martes, 16 de junio de 2020

Paquete readxl para importar registros de Excel a RStudio

Al dar mis primeros pasos en el mundo del lenguaje de programación R, uno de los primeros paquetes (packages) que aparecieron en mi camino fue readxl, en su versión 1.3.1 nos permite leer archivos de Excel (Read Excel files), en este artículo te mostraremos como hacer uso de una herramienta básica, pero al mismo tiempo últil y poderosa.



Paquete readxl

El paquete readxl  nos permite importar registros desde archivos de Microsoft Excel con  extensión xlsx y xls, a continuación te mostramos como instalar y trabajar con dicho paquete, en RStudio.



Instalando readxl

Procedemos a usar la función install.packages() en el área de edición de RStudio para proceder a instalar el paquete readxl.








Luego activamos al paquete mediante la función library() para poder trabajar con las distintas funciones que nos propociona el paquete.





Procedemos a ejecutar la siguiente línea de código R, para hacer  uso del paquete readxl, asignando la correspondiente variable, indicando la ruta de donde se encuentra el archivo de Excel a importar. Para luego proceder a utilizar la función View() y poder visualizar los registros importados a RStudio.






Mostrando los registros importados mediante la función View()





Descarga el Dataset de Excel para replicar lo mostrado en el artículo: https://bit.ly/30V4aR3

El siguiente vídeo muestra como hacer uso del paquete readxl, encontraras las instrucciones a partir del minuto 4:32