{"id":2105,"date":"2023-12-05T14:21:32","date_gmt":"2023-12-05T14:21:32","guid":{"rendered":"https:\/\/see-ec.org\/wordpress\/?post_type=product&#038;p=2105"},"modified":"2025-03-12T14:23:42","modified_gmt":"2025-03-12T19:23:42","slug":"big-data-con-apache-spark-usando-r","status":"publish","type":"product","link":"https:\/\/see-ec.org\/wordpress\/producto\/big-data-con-apache-spark-usando-r\/","title":{"rendered":"Big Data con Apache Spark usando R"},"content":{"rendered":"<p>El ingrediente m\u00e1s importante del an\u00e1lisis de datos siempre son los datos. Cada vez que visitamos una p\u00e1gina web, miles de datos son almacenados: qu\u00e9 se nos mostr\u00f3, qu\u00e9 clickeamos, cu\u00e1nto tiempo estuvimos en la p\u00e1gina, d\u00f3nde estaba el puntero del rat\u00f3n, etc. As\u00ed tambi\u00e9n lo que no hacemos, genera informaci\u00f3n (como cuando ignoramos un art\u00edculo sugerido). Toda esta inundaci\u00f3n de informaci\u00f3n exigen la existencia herramientas de anal\u00edtica para grandes vol\u00famenes de datos, de las cuales, muchas son &#8221;gratis&#8221;.<\/p>\n<p>Lenguajes como R y Python con miles de miles de librer\u00edas han democratizado el an\u00e1lisis de datos. Pero para procesar grandes vol\u00famenes de datos, estos necesitan funcionar sobre arquitecturas distribuidas (escalamiento horizontal), dado que el escalamiento vertical o a\u00f1adir m\u00e1s poder a una m\u00e1quina puede volverse muy costoso (en t\u00e9rminos costo beneficio). Cuando trabajemos con dicha arquitectura necesitaremos software que pueda distribuir el trabajo a varias m\u00e1quinas. All\u00ed entra en escena Apache Spark, el cual puede ser usado en R a trav\u00e9s de sparklyr.<\/p>\n<p>En este curso aprender\u00e1s sobre la computaci\u00f3n distribuida y como \u00e9sta (basada en Spark) nos ayuda a llevar nuestros an\u00e1lisis a gran escala, desde la carga, hasta el modelamiento de los datos.<\/p>\n<h3>Contenido<\/h3>\n<ul>\n<li>Introducci\u00f3n: Spark, R, tidyverse y sparklyr<\/li>\n<li>Prerrequisitos, conexiones y uso de spark<\/li>\n<li>Lectura y escritura de datos<\/li>\n<li>Procesamiento y visualizaci\u00f3n de datos<\/li>\n<li>An\u00e1lisis supervisado con MLlib<\/li>\n<li>An\u00e1lisis no supervisado con MLlib<\/li>\n<li>An\u00e1lisis exploratorio e ingenier\u00eda de variables<\/li>\n<li>Pipelines<\/li>\n<li>Optimizaci\u00f3n de hiperpar\u00e1metros<\/li>\n<li>Planes de validaci\u00f3n cruzada<\/li>\n<li>Extensiones<\/li>\n<\/ul>\n","protected":false},"excerpt":{"rendered":"<h3>Capacitador<\/h3>\n<h4>Hugo Porras, MSc.<\/h4>\n<p>Ingeniero en ciencias econ\u00f3micas y financieras de la Escuela Polit\u00e9cnica Nacional y m\u00e1ster en inteligencia artificial de la Universidad Internacional de la Rioja. Tiene 4 a\u00f1os de experiencia como cient\u00edfico de datos y 6 en el \u00e1rea de investigaci\u00f3n.<br \/>\nActualmente se desempe\u00f1a como Cient\u00edfico de Datos Senior en Banco Pichincha. Trabaja adem\u00e1s como consultor e investigador independiente en temas relacionados a finanzas de bienes ra\u00edces, econom\u00eda del bienestar, econom\u00eda geogr\u00e1fica e IA aplicada a las ciencias sociales.<\/p>\n","protected":false},"featured_media":2109,"template":"","meta":{"nf_dc_page":"","content-type":"","om_disable_all_campaigns":false,"_uag_custom_page_level_css":"","_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"_uf_show_specific_survey":0,"_uf_disable_surveys":false},"product_brand":[],"product_cat":[41,35,43],"product_tag":[],"class_list":{"0":"post-2105","1":"product","2":"type-product","3":"status-publish","4":"has-post-thumbnail","6":"product_cat-big-data","7":"product_cat-data-science","8":"product_cat-r","10":"first","11":"outofstock","12":"virtual","13":"product-type-simple"},"aioseo_notices":[],"uagb_featured_image_src":{"full":["https:\/\/i0.wp.com\/see-ec.org\/wordpress\/wp-content\/uploads\/2023\/12\/BIG-DATA-CON-APACHE-SPARK-USANDO-R-1.png?fit=1000%2C1000&ssl=1",1000,1000,false],"thumbnail":["https:\/\/i0.wp.com\/see-ec.org\/wordpress\/wp-content\/uploads\/2023\/12\/BIG-DATA-CON-APACHE-SPARK-USANDO-R-1.png?resize=150%2C150&ssl=1",150,150,true],"medium":["https:\/\/i0.wp.com\/see-ec.org\/wordpress\/wp-content\/uploads\/2023\/12\/BIG-DATA-CON-APACHE-SPARK-USANDO-R-1.png?fit=300%2C300&ssl=1",300,300,true],"medium_large":["https:\/\/i0.wp.com\/see-ec.org\/wordpress\/wp-content\/uploads\/2023\/12\/BIG-DATA-CON-APACHE-SPARK-USANDO-R-1.png?fit=678%2C678&ssl=1",678,678,true],"large":["https:\/\/i0.wp.com\/see-ec.org\/wordpress\/wp-content\/uploads\/2023\/12\/BIG-DATA-CON-APACHE-SPARK-USANDO-R-1.png?fit=678%2C678&ssl=1",678,678,true],"1536x1536":["https:\/\/i0.wp.com\/see-ec.org\/wordpress\/wp-content\/uploads\/2023\/12\/BIG-DATA-CON-APACHE-SPARK-USANDO-R-1.png?fit=1000%2C1000&ssl=1",1000,1000,true],"2048x2048":["https:\/\/i0.wp.com\/see-ec.org\/wordpress\/wp-content\/uploads\/2023\/12\/BIG-DATA-CON-APACHE-SPARK-USANDO-R-1.png?fit=1000%2C1000&ssl=1",1000,1000,true],"post-thumbnail":["https:\/\/i0.wp.com\/see-ec.org\/wordpress\/wp-content\/uploads\/2023\/12\/BIG-DATA-CON-APACHE-SPARK-USANDO-R-1.png?resize=150%2C150&ssl=1",150,150,true],"gurukul-related":["https:\/\/i0.wp.com\/see-ec.org\/wordpress\/wp-content\/uploads\/2023\/12\/BIG-DATA-CON-APACHE-SPARK-USANDO-R-1.png?resize=200%2C125&ssl=1",200,125,true],"woocommerce_thumbnail":["https:\/\/see-ec.org\/wordpress\/wp-content\/uploads\/2023\/12\/BIG-DATA-CON-APACHE-SPARK-USANDO-R-1-300x300.png",300,300,true],"woocommerce_single":["https:\/\/see-ec.org\/wordpress\/wp-content\/uploads\/2023\/12\/BIG-DATA-CON-APACHE-SPARK-USANDO-R-1.png",600,600,false],"woocommerce_gallery_thumbnail":["https:\/\/see-ec.org\/wordpress\/wp-content\/uploads\/2023\/12\/BIG-DATA-CON-APACHE-SPARK-USANDO-R-1-100x100.png",100,100,true]},"uagb_author_info":{"display_name":"see.ecuador2","author_link":"https:\/\/see-ec.org\/wordpress\/author\/"},"uagb_comment_info":0,"uagb_excerpt":"Capacitador Hugo Porras, MSc. Ingeniero en ciencias econ\u00f3micas y financieras de la Escuela Polit\u00e9cnica Nacional y m\u00e1ster en inteligencia artificial de la Universidad Internacional de la Rioja. Tiene 4 a\u00f1os de experiencia como cient\u00edfico de datos y 6 en el \u00e1rea de investigaci\u00f3n. Actualmente se desempe\u00f1a como Cient\u00edfico de Datos Senior en Banco Pichincha. Trabaja&hellip;","jetpack_sharing_enabled":true,"_links":{"self":[{"href":"https:\/\/see-ec.org\/wordpress\/wp-json\/wp\/v2\/product\/2105","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/see-ec.org\/wordpress\/wp-json\/wp\/v2\/product"}],"about":[{"href":"https:\/\/see-ec.org\/wordpress\/wp-json\/wp\/v2\/types\/product"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/see-ec.org\/wordpress\/wp-json\/wp\/v2\/media\/2109"}],"wp:attachment":[{"href":"https:\/\/see-ec.org\/wordpress\/wp-json\/wp\/v2\/media?parent=2105"}],"wp:term":[{"taxonomy":"product_brand","embeddable":true,"href":"https:\/\/see-ec.org\/wordpress\/wp-json\/wp\/v2\/product_brand?post=2105"},{"taxonomy":"product_cat","embeddable":true,"href":"https:\/\/see-ec.org\/wordpress\/wp-json\/wp\/v2\/product_cat?post=2105"},{"taxonomy":"product_tag","embeddable":true,"href":"https:\/\/see-ec.org\/wordpress\/wp-json\/wp\/v2\/product_tag?post=2105"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}