
El curso virtual "Machine Learning escalable sobre Big Data usando Apache Spark - Curso Virtual - Coursera", es un curso con diferentes contenidos y que ofrece clases en video de . Explora sus características esenciales, y dale click al botón naranja para obtener información detallada en la plataforma de e-Learning Coursera
Este curso lo capacitará con las habilidades para escalar tareas de ciencia de datos y aprendizaje automático (ML) en conjuntos de Big Data usando Apache Spark. La mayoría del trabajo de aprendizaje automático del mundo real implica conjuntos de datos muy grandes que van más allá de las limitaciones de CPU, memoria y almacenamiento de una sola computadora. Apache Spark es un marco de código abierto que aprovecha la computación en clúster y el almacenamiento distribuido para procesar conjuntos de datos extremadamente grandes de manera eficiente y rentable. Por lo tanto, un conocimiento aplicado del trabajo con Apache Spark es un gran activo y un diferenciador potencial para un ingeniero de aprendizaje automático. Después de completar este curso, podrá: - obtener una comprensión práctica de Apache Spark y aplicarlo para resolver problemas de aprendizaje automático que involucran datos pequeños y grandes - comprender cómo se escribe el código paralelo, capaz de ejecutarse en miles de CPU. - hacer uso de clústeres de cómputo a gran escala para aplicar algoritmos de aprendizaje automático en petabytes de datos usando Apache SparkML Pipelines. - eliminar los errores de falta de memoria generados por los marcos tradicionales de aprendizaje automático cuando los datos no caben en la memoria principal de una computadora - probar miles de modelos de ML diferentes en paralelo para encontrar el que mejor funciona, una técnica utilizada por muchos Kagglers exitosos - ( Opcional) ejecute sentencias SQL en conjuntos de datos muy grandes usando Apache SparkSQL y la API Apache Spark DataFrame. Inscríbete ahora para conocer las técnicas de aprendizaje automático para trabajar con Big Data que han aplicado con éxito empresas como Alibaba, Apple, Amazon, Baidu, eBay, IBM, NASA, Samsung, SAP, TripAdvisor, Yahoo!, Zalando y muchas otras. NOTA: Practicará la ejecución de tareas de aprendizaje automático de forma práctica en un clúster de Apache Spark proporcionado por IBM sin cargo durante el curso, que puede seguir utilizando después. Requisitos previos: - Programación básica en Python - Aprendizaje automático básico (en este curso también se proporcionan videos de introducción opcionales) - Habilidades básicas de SQL para contenido opcional Se recomiendan los siguientes cursos antes de tomar esta clase (a menos que ya tenga las habilidades) https:// www.coursera.org/learn/python-for-applied-data-science o similar https://www.coursera.org/learn/machine-learning-with-python o similar https://www.coursera.org/ learn/sql-data-science para conferencias opcionales
Hola, ¿En qué puedo ayudarte? ¿te interesa algún curso? ¿Sobre qué tema?
Add a review