Mostrando las entradas con la etiqueta lenguaje de programación R. Mostrar todas las entradas
Mostrando las entradas con la etiqueta lenguaje de programación R. Mostrar todas las entradas

lunes, 8 de marzo de 2021

Machine Learning con el lenguaje de programación R

El aprendizaje automático (Machine Learning) es una rama de la Inteligencia Artificial, que busca desarrollar técnicas y algoritmos que permitan a los sistemas computacionales, a las computadoras aprender, sin programarlas explicitamente para realizar dicha acción. 

En este artículo te mostraremos como obtener la certificación Machine Learning with R (Aprendizaje Automático con R), curso online y gratuito, a través del IBM Cognitive Class, plataforma que ofrece curso relacionados a la Ciencia de Datos con el soporte del gigante azul IBM, cuando termines con la certificación obtendras un badge oficial de IBM, el cual podras colocar en tu CV o compartir por Facebook, Twitter o LinkedIn.



Ingresamos a la web del IBM Cognitive Class a través de la siguiente url https://cognitiveclass.ai/ que nos permitira acceder a la serie de cursos online y gratuitos enfocados en la ciencia de datos, con el resplado y soporte de IBM, luego vamos por el curso Machine Learning with R, es desde allí donde comenzaremos a dar nuestros primeros pasos en el mundo del Aprendizaje Automático, este curso te enfoca en el aprendizaje supervisado y no supervisado, podras trabajar online con Jupyter Notebook.





El curso consta de 5 módulos: Machine Learning Vs. Statistical Modeling, Supervised Learning I, Supervised Learning II, Unsupervised Learning I, Dimensionality Reduction & Collaborative Filtering; cada módulo se divide en distintos capítulos, dependiendo de la complejidad del tema, laboratorios (Labs) previos a tomar el examen asignado a cada módulo,(Review Questions), al finalizar todos los módulos podras acceder al examen final, el cual podras pasar con el  70% como nota aprobatoria, las siguiente imágenes muestran la estructura del Machine Learning with R.




Al terminar con todos los módulos del curso,laboratorios, y las Review Questions, pasando el examen final de manera satisfactoria, obtienes la certificación MACHINE LEARNING WITH R, otorgada por el Cognitive Class, con el respaldo de IBM,así como el IBM badge Machine Learning with R - Level 1, que podras colocar en tu CV o compartir en redes sociales como Facebook, Twitter y LinkedIN; recomendamos sobre manera este curso, ya que te permitira obtener una visión más amplia de lo que es aprendizaje automático (Machine Learning) sus algoritmos y modelos. 







El siguiente vídeo muestra como obtener la certificación Machine Learning with R



domingo, 9 de agosto de 2020

Ejecutando sentencias SQL en RStudio

El uso del paquete SQLDF nos permite ejecutar sentencias SQL sobre  Data Sets precargados o importados al área de edición del entorno de desarrollo RStudio, el siguiente artículo muestra como trabajar con dicho paquete, haremos uso del Data Set mtcars, como modelo para ejecutar las sentencias.


Procedemos a activar el paquete sqldf haciendo uso de la función library() esto también activara paquete adicionales tales como gsubfn, proto y RSQLite como pueden apreciar en las imágenes que mostramos a continuación.














A continuación haremos uso de las siguientes funciones: data() , attach(), View(), éstas funciones nos pemitiran mostrar los Data Sets que ya vienen precargados en RStudio, cargar el data set mtcars que utilizaremos para ejecutar las sentencias SQL y para visualizar los registros contenido en mtcars respectivamente.













La siguiente imagen nos muestra el data set mtcars dentros de los distintos demos preinstalados en el lenguaje de programación R, se utilizo la función data()



















La función View() nos permitira visualizar los registros contenidos en el data set mtcars como se muestra a continuación a través de la siguiente imagen.



















Finalmente, haremos uso del paquete sqldf ejecutandos sentencias SQL sobre el data set mtcars como se muestra en las siguiente imágenes.


Procedemos a crear el objeto all_mtcars <- sqldf("select mpg,cyl from mtcars where cyl >=6") que nos muestra los campos mpg y cyl, bajo la condición de muestre los registros del campo cyl mayores o igual a 6. Siendo el resultado final la imagen que mostramos a continuación.




El siguiente vídeo muestra paso a paso como hacer uso del paquete sqldf y ejecutar sentencias SQL sobre el data set mtcars.




jueves, 25 de junio de 2020

Trabajando con distintas versiones de R en RStudio

Al trabajar con el lenguaje de programación R, podemos llegar a situaciones en que para ejecutar determinado paquete debemos usar una versión en especifico de R, en este artículo te mostraremos un truco que involucra a la tecla CTRL (control) que permite cambiar entre versiones de R antes de ejecutar el entorno de desarrollo RStudio.


El entorno en que estamos trabajando es Windows 10 y tenemos instaladas dos versiones del lenguaje de programación R, la 3.6.0 y 4.0.0 y necesitamos ejecutar un paquete en especifico que sólo se activa con determinada versión, entra en el escenario la tecla CTRL que al mantenerla presionada en todo momento antes de activar RStudio nos mostrara antes de ejecutar la aplicación, nos mostrara una ventana que nos permitira escoger entre las distintas versiones de R que tenemos instaladas en nuestros equipos.

















Podras escoger entre las distintas versiones de R instaladas en tu sistema.
























Finalmente, tenemos que señalar que la versión de R que eligas se mantendra activa,hasta que no realices la operación contraria y vuelvas a elegir la versión por defecto instalada en tu equipo.


El siguiente vídeo te muestra como cambiar entre distintas versiones de R.




martes, 23 de junio de 2020

Importar registros desde Stata a RStudio

El software estadístico Stata es uno de los más usados en el ambito de la investigación científica, en esta edición te mostraremos como importar registros desde Stata hacia el entorno de desarrollo RStudio, haciendo uso del paquete foreign, también resolveremos uno de los principales problemas en relación a la versión de Stata con que se deben guardar los archivos con extensión *.dta para no tener conflictos al momento de importar registros a R.






Procedemos a cargar el paquete foreign haciendo uso de la función library()








A continuación mostraremos los registros a importar a RStudio, contenidos en el archivo Stata_data_001.dta, que fue creado usando la versión de Stata 15.1






























Crearemos la variable tabla_Stata, que contendra los registros almacenados en el archivo Stata_data_001.dta (versión 15.1) para ser importados en RStudio, procedemos a la creación del objeto y obtenemos el siguiente  mensaje de de error not a Stata version 5-12 .dta file", foreign (versión 0.8) como paquete es muy últil pero en relación a importar archivos de Stata sólo trabaja con las versiones 5-12 con extensión .dta.







Para poder salvar este escoyo, procedemos a guardar nuestros registros bajo el formato de la versión 12 de Stata.






















Finalmente, creamos el objeto tabla_Stata, recordar guarda el archivo bajo la versión 12, y terminamos visualizando los registros importados a RStudio, haciendo uso de la función View().























Descargar el archivo de Stata: https://bit.ly/3hSb4fL 

El siguiente vídeo muestra como importar registros desde Stata a RStudio.





jueves, 18 de junio de 2020

Importar registros desde MySQL a RStudio

ODBC (Open DataBase Connetivity) permite al usuario acceder a distintas y diferentes sistemas de gestion de base de datos (SGBD) como SQL Server, MySQL, PostgreSQL entre otros, desde cualquier aplicación, para este artículo haremos uso del sistema operativo Windows 10, nuestros lenguaje de programación favorito R y su entorno de desarrollo RStudio y un paquete (package) muy particualar RODBC




RODBC para importar registros mediante una conexión ODBC

El paquete RODBC nos permite establecer una conexón ODBC entre el lenguaje de programación R y Bases de datos relacionales como SQL Server, Oracle, MySQL entre ortas  para poder importar registros hacia el hacia el área de edición de RStudio.

A continuación te mostraremos como establecer una conexión ODBC entre el gestor de base de datos MySQL y RStudio para poder importar registros, trabajaremos con la herramienta ODBC de 64 bits de Windows 10.


Activaremos el paquete RODBC, mediante el la función library()










Luego procedemos activar la herramienta Origenes de Datos ODBC (64 bits) para poder crear la conexión ODBC.















Aparecera la siguiente ventana donde seleccionaremos el controlador MySQL ODBC 8.0 ANSI Driver para poder crear el origen de datos.






















Luego procederemos a configurar el origen de datos estableciendo el Data Source como "test_odbc", el usurio para MySQL por lo general es root, ingresamos el password respectivo y seleccionamos la base de datos desde donde importaremos los registros.





En el área de edición de RStudio, ya habiendo activado el paquete RODBC, haremos uso de dos comandos en especifico odbcConnect y sqlQuery.


odbcConnect permite configurar el origen de datos, "test_odbc", a través de uid señalamos el super usuario de mysql (root), pwd nos permite ingresar el password para acceder a la base de datos.


sqlQuery nos permite ejecutar sentencias SQL para visualizar los registros contenidos en las tablas de la base de datos en MySQL.









Finalmente, visualizamos los registros importados mediante el comando View()


















El siguiente vídeo muestra como crear una conexión ODBC entre MySQL y RStudio





lunes, 15 de junio de 2020

Importar registros desde Excel a RStudio

Una de las funciones básicas dentro del manejo, del uso de todo lenguaje de programación (R, Python, C++) y su entorno de desarrollo (Aptana, NetBeans, Visual Studio, etc.) es la de importar registros desde distintas fuentes, desde distintos origenes, tales como archivos de texto, bases de datos (SQL Server, Oracle, MySQL, entre otros.) y hojas de cálculo; nuestro lenguaje favorito R, no es ajeno a eso, el siguiente artículo muestra como hacer uso de las herramientas (built-in tools) que nos proporciona el entorno de desarrollo (IDE) RStudio para importar registros desde Microsoft Excel (archivos con extensiones xls y xlsx) hacia el área de edición de RStudio para poder gestionar los datos importados de manera fácil y rápida.


Import Dataset

Debemos tener en cuenta, que a pesar de hacer uso de las herramientas (built-in tools) que nos proporciona RStudio para realizar las operaciones de importar registros desde distintas fuentes al área de edición del entorno de desarrollo, en todo momento, cuando ejecutamos alguna acción en la interfaz gráfica, hay paquetes (R packages) especificamente diseñados para el lenguaje de programación R que se están ejecutando.
En la barra de Menu, seleccionas la opción File, para luego hacer click en Import Dataset, esto te mostrara un submenu con distintas opciones, debes elegir la opción From Excel.
La siguiente imagen muestra como hacerlo.





Importando registros de Excel a RStudio


Luego de hacer click en la opción From Excel (Desde Excel), se mostrara una ventana llamada Import Excel Data (Importar registros de Excel) que te permitira navegar por las carpetas donde almacenas tus archivos de Excel (con extesión xls y xlsx), seleccionar dichos archivos y poder previsualizarlos antes de realizar la importación de los registros.
Las opciones claves en la ventana Import Excel Data son Browse, File/URL y Data Preview, el primero te permite seleccionar los archivos Excel que se encuentran en tu equipo o en la nube (dirección URL)
Las siguientes imágenes te muestran dichas opciones y la visualización previa de los registros de Excel


Luego de seleccionar el archivo de Excel, contaras con una vista previa (Data Preview) de los registros a importar, sólo debes hacer click en el boton Import (Importar) para poder tener los registros en el área de edición de RStudio, cabe señalar que este procedimiento funciona tanto para archivos de Excel con extensiones xls y xlsx, para efectos del proceso de importación, debemos señalar que los archivos con extensión xls almacenan información en formato binario, mientras que los archivos con extensión xlsx almacenan información usando XML.






Finalmente, podras visualizar los registros que acabas de importar desde Excel en el área de edición de RStudio, listo para trabajar con ellos, cabe señalar que solo utilizamos la interfaz grafica, RStudio sigue ejecutando las distintas funciones y comandos del lenguaje de programación R, como puedes apreciar en la siguiente imágen, en el área de la consola, se ejecuto el paquete readxl, el cual nos permite sólo leer archivos de Excel (readxl package 1.3.1 - read Excel filesen un próximo artículo te mostraremos como utilizar dicho paquete para importar registros desde Excel a R. 


Click en el enlace para ir al artículo en relación al paquete readxl: https://bit.ly/2zEgJEV






















Descarga el Dataset de Excel para replicar lo mostrado en el artículo: https://bit.ly/30V4aR3

Te comparto el siguiente vídeo que te muestra como realizar el procedimiento de importar registros de Excel a RStudio paso a paso.