Zrychlený program certifikátů: Data Science
University of California, Irvine - Division of Continuing Education
Klíčová informace
Umístění kampusu
Irvine, Spojené státy americké
Jazyky
Angličtina
Studijní formát
Na kampusu
Doba trvání
3 months
Tempo
Plný úvazek
Školné
USD 7 900 / per course *
Uzávěrka přihlášek
Vyžádejte si informace
Nejbližší datum zahájení
Vyžádejte si informace
* přibližné celkové náklady: 14 100 USD, bez letenek; stáž: 2 900 $
Úvod
Přehled
Data Science je neustále hodnocena jako jedna z nejžádanějších profesí. Potřeba profesionálů, kteří mohou spravovat a využívat poznatky z dat, je jasnější než kdykoli předtím. Učební plán vyučovaný v tomto programu je navržen tak, aby splňoval rostoucí multidisciplinární potřeby profesionálů v oblasti dat. Pokrytím široké škály témat program řeší širokou škálu dovedností potřebných pro práci na úspěšných projektech založených na datech. Zahrnuty jsou témata zjišťování a predikce založené na datech, datové inženýrství v měřítku (kontrola, čištění, transformace a modelování dat), strukturovaná a nestrukturovaná data, výpočetní statistiky, rozpoznávání vzorů, dolování dat, vizualizace dat, databáze, SQL, programování v Pythonu, a strojové učení.
3měsíční postgraduální program UC Irvine v programu Data Science (ACP) v oblasti datové vědy pokrývá širokou škálu témat v oblasti datové vědy, včetně zjišťování a predikce na základě dat, datového inženýrství v měřítku (kontrola, čištění, transformace a modelování dat) , strukturovaná a nestrukturovaná data, výpočetní statistiky, rozpoznávání vzorů, dolování dat, vizualizace dat, databáze, SQL, Python a strojové učení.
Výhody
- Využijte technické techniky k získání přehledu a obchodních informací.
- Aplikujte matematické koncepty včetně pravděpodobnosti, závěru a modelování na praktickou aplikaci datového projektu.
- Popište a použijte standardní průmyslové nástroje a technologie potřebné k modelování a analýze velkých datových sad.
- Využijte přístup k modelování dat k optimálnímu obchodnímu rozhodnutí.
- Implementujte algoritmy strojového učení.
- Aplikujte nástroje pro analýzu textu na nestrukturované a strukturované datové sady.
- Vypracovat a implementovat plán datového skladu.
- Získejte konkurenční výhodu na globálním trhu práce prostřednictvím stáže v americké společnosti.
Kdo by se měl zúčastnit
Tento program je určen pro profesionály v různých průmyslových odvětvích a pracovních pozicích, kteří chtějí pomoci své organizaci porozumět a využít obrovské množství různorodých dat, která shromažďují. Mezi další, kteří by z tohoto programu měli prospěch, patří datoví inženýři, analytici dat, počítačoví vědci, obchodní analytici, administrátoři databází, vědci a statistici.
Požadavky na certifikáty
Chcete-li získat certifikát na UCI divizi kontinuálního vzdělávání, studenti musí absolvovat všechny požadované kurzy se stupněm "C" nebo lepší.
Osnovy
Praktická matematika a statistika pro datovou vědu
Praktická matematika a statistika jsou základem oborů datové vědy a prediktivní analýzy. Statistiky se používají v každé části zpracování obchodních, vědeckých a institucionálních dat. Tento kurz zahrnuje základní statistické dovednosti potřebné pro Data Science a Predictive Analytics. Jedná se o kurz zaměřený na aplikace a přístup je praktický. Studenti se seznámí s několika statistickými technikami a budou diskutovat o situacích, ve kterých by se každá z těchto technik používala, o předpokladech jednotlivých metod, o tom, jak provést analýzu a jak interpretovat výsledky. Tento kurz začíná úvodem do analýzy dat. Kurz dále zahrnuje základní pojmy deskriptivní statistiky, pravděpodobnosti a inferenční statistiky, které zahrnují centrální limitní větu a testování hypotéz. Odtamtud se kurz zaměří na různé statistické testy, včetně Chi-Squareova testu nezávislosti, t-testů, korelace, ANOVA, lineární regrese, časových řad a aplikace dříve naučených technik v nových situacích.
Úvod do programování v Pythonu
Úvod do Pythonu je úvod do programování pomocí Pythonu pro začátečníky. Tento kurz je určen pro ty, kteří nemají zkušenosti s programováním a nemají technické vzdělání. Je pro ty, kteří chtějí jemný úvod. Po tomto kurzu mohou studenti chtít absolvovat mírně pokročilý nebo pokročilejší kurz Pythonu. Nebo se mohou cítit dost sebevědomí, aby se mohli začít učit sami. Pokud nemáte pozadí v Pythonu, ale máte dobré zázemí v jazyce Java, C nebo jiném jazyce, může vám tento kurz připadat pomalý. Studenti se naučí následující: jak používat typy proměnných, řízení toku a funkce, jak komunikovat se systémem prostřednictvím Pythonu, jak psát jednoduché skripty pro zpracování textu a jak používat Jupyter, populární vývojový nástroj pro Python.
Základy datové vědy
Cílem tohoto kurzu je demystifikovat datovou vědu a seznámit studenty s klíčovými dovednostmi, technikami a koncepty datových vědců. Počínaje základními koncepty, jako je taxonomie analytiky, mezioborový standardní proces pro dolování dat a diagnostika dat, kurz poté přejde k porovnání datové vědy s klasickými statistickými technikami. Přehled nejběžnějších technik používaných ve vědě o datech, včetně analýzy dat, statistického modelování, datového inženýrství, relačních databází, SQL a NoSQL, manipulace s daty v měřítku (big data), algoritmů pro dolování dat, kvality dat, nápravy a budou pokryty operace konzistence.
Datové inženýrství
Tento kurz je navržen tak, aby zlepšil znalosti studentů v oblasti navrhování dat, správy dat, datového skladu, modelování dat a dovedností manipulace s dotazy. Témata zahrnují techniky a metody pro identifikaci, extrakci a přípravu dat pro zpracování pomocí databázového softwaru. Získejte přehled o základních technikách datového inženýrství, včetně normalizace dat, datového inženýrství, relačních a nerelačních databází, SQL a NoSQL, manipulace s daty v měřítku (big data), algoritmů pro datové operace. Studenti budou pracovat v týmech na závěrečném projektu, který bude zkoumat, analyzovat, sumarizovat a prezentovat nálezy v reálném velkém datovém souboru.
Pokročilá vizualizace
Vizualizace hraje zásadní roli v porozumění vlastnostem a vztahům v datech k získání přehledů a komunikaci výsledků. Ať už je analytika popisná, diagnostická, preskriptivní nebo proskriptivní, vizualizace je nezbytná v každém analytickém cyklu. Tento kurz se zaměří na použití různých metod a technik v různých fázích analytického cyklu, například během přípravy dat, modelování a vytváření sestav. Studenti se naučí techniky vizualizace jednorozměrných, vícerozměrných, časových, textových, hierarchických a síťových / grafických dat jak v ad hoc analýze, tak v automatizovaném generování.
Velká analýza dat
Podniky používají technologie jako MapReduce, Hadoop, Yarn a Apache Spark k získání hodnoty z Big Data. Tento kurz poskytuje podrobný přehled o Hadoop a Spark, základních kamenech zpracování velkých dat. Aby studenti vykrystalizovali koncepty, které stojí za Hadoopem a Sparkem, projdou řadou krátkých, zaměřených cvičení. Zahrnuté koncepty zahrnují architekturu Hadoop, Apache Spark Big Data Framework, příjem dat, distribuované zpracování a funkční programování. Kromě toho se studenti naučí, jak konfigurovat a instalovat klastr Hadoop, psát základní programy MapReduce, využívat pokročilé programovací postupy MapReduce a využívat rozhraní jako Pig a Hive k interakci s Hadoop.
Stáže
Jako volitelný poslední kurz a za příplatek ve výši 2 900 $ máte možnost po dobu 10 týdnů aplikovat akademickou teorii a získávat praktické zkušenosti v různých oborech a oborech. Výzkumný projekt poskytuje další školení. Součástí stáže jsou také workshopy Resume Development and Interviewing Skills.
Plán
Studenti budou zařazeni do ranního (9: 00-12: 00) nebo odpoledního (13: 00-16: 00) rozvrhu. Kurzy v programu jsou přijímány postupně, jeden je dokončen před pokračováním k dalšímu. Harmonogramy nejsou zaručeny a mohou se změnit. Konečný harmonogram bude poskytnut první den programu.
* Uznáváme, že toto je pro mnoho našich studentů a jejich rodin náročné období, proto jsme rádi, že nabízíme 25% slevu na zimní výuku ACP 2021 v AKT a 33% slevu na výuku při přihlašování do vzdálených kurzů ACP na jaře 2021.
Osnovy
Osnovy
Praktická matematika a statistika pro datovou vědu
Praktická matematika a statistika jsou základem oborů Data Science a Predictive Analytics. Statistiky se používají v každé části obchodního, vědeckého a institucionálního zpracování dat. Tento kurz pokrývá základní statistické dovednosti potřebné pro Data Science a Predictive Analytics. Jedná se o aplikačně orientovaný kurz a přístup je praktický. Studenti se podívají na několik statistických technik a prodiskutují situace, ve kterých by se každá technika použila, předpoklady vytvořené každou metodou, jak nastavit analýzu a také jak interpretovat výsledky. Tento kurz začíná úvodem do analýzy dat. Dále se kurz zabývá základními pojmy deskriptivní statistiky, pravděpodobnosti a inferenční statistiky, mezi které patří centrální limitní věta a testování hypotéz. Odtud se kurz zaměří na různé statistické testy, včetně Chí-kvadrát testu nezávislosti, t-testů, korelace, ANOVA, lineární regrese, časových řad a aplikace dříve naučených technik v nových situacích.
Úvod do programování v Pythonu
Úvod do Pythonu je úvod do programování v Pythonu pro začátečníky. Tento kurz je určen pro ty, kteří nemají žádné zkušenosti s programováním a nemají technické znalosti. Je pro ty, kteří chtějí jemný úvod. Po tomto kurzu mohou studenti chtít absolvovat kurz Pythonu pro středně pokročilé nebo pokročilé. Nebo se mohou cítit dostatečně sebevědomě, aby se začali učit sami. Pokud nemáte znalosti v Pythonu, ale máte dobré znalosti v Javě, C nebo jiném jazyce, může vám tento kurz připadat pomalý. Studenti se naučí následující: jak používat typy proměnných, řízení toku a funkce, jak komunikovat se systémem prostřednictvím Pythonu, jak psát jednoduché skripty pro zpracování textu a jak používat Jupyter, oblíbený vývojový nástroj pro Python.
Základy datové vědy
Cílem tohoto kurzu je demystifikovat datovou vědu a seznámit studenty s klíčovými dovednostmi, technikami a koncepty datových vědců. Počínaje základními koncepty, jako je analytická taxonomie, mezioborový standardní proces pro dolování dat a diagnostika dat, kurz poté přejde ke srovnání datové vědy s klasickými statistickými technikami. Přehled nejběžnějších technik používaných v datové vědě, včetně analýzy dat, statistického modelování, datového inženýrství, relačních databází, SQL a NoSQL, manipulace s daty ve velkém měřítku (big data), algoritmů pro dolování dat, kvality dat, nápravy a budou pokryty operace konzistence.
datové inženýrství
Tento kurz je navržen tak, aby zlepšil dovednosti studentů v oblasti návrhu dat, správy dat, datového skladu, modelování dat a manipulace s dotazy. Témata zahrnují techniky a metody pro identifikaci, extrakci a přípravu dat pro zpracování databázovým softwarem. Získejte přehled o základních technikách datového inženýrství, včetně normalizace dat, datového inženýrství, relačních a nerelačních databází, SQL a NoSQL, manipulace s daty ve velkém měřítku (big data), algoritmů pro datové operace. Studenti budou pracovat v týmech na závěrečném projektu, aby prozkoumali, analyzovali, shrnuli a prezentovali zjištění v reálném světě velkých dat.
Pokročilá vizualizace
Vizualizace hraje zásadní roli v porozumění vlastnostem a vztahům v datech pro získávání náhledů a sdělování výsledků. Ať už je analytika popisná, diagnostická, normativní nebo proskriptivní, vizualizace je nezbytná během každého analytického cyklu. Tento kurz se zaměří na aplikaci různých metod a technik v různých fázích analytického cyklu, jako je příprava dat, modelování a reporting. Studenti se naučí techniky vizualizace jednorozměrných, vícerozměrných, časových, textových, hierarchických a síťově/grafových dat jak v ad hoc analýze, tak v automatizovaném generování.
Analýza velkých dat
Podniky využívají technologie jako MapReduce, Hadoop, Yarn a Apache Spark k získávání hodnoty z velkých dat. Tento kurz poskytuje hloubkový přehled o Hadoop a Spark, základních kamenech zpracování velkých dat. Aby vykrystalizovali koncepty za Hadoopem a Sparkem, studenti budou pracovat prostřednictvím série krátkých, zaměřených cvičení. Pokryté koncepty zahrnují architekturu Hadoop, Apache Spark Big Data Framework, příjem dat, distribuované zpracování a funkční programování. Kromě toho se studenti naučí, jak nakonfigurovat a nainstalovat cluster Hadoop, psát základní programy MapReduce, využívat pokročilé postupy programování MapReduce a využívat rozhraní jako Pig a Hive pro interakci s Hadoop.
Ideální studenti
Kdo by se měl zúčastnit
Tento program je určen pro profesionály v různých odvětvích a pracovních funkcích, kteří chtějí pomoci své organizaci pochopit a využít obrovské množství různorodých dat, která shromažďují. Mezi další, kteří by z tohoto programu měli prospěch, patří datoví inženýři, datoví analytici, počítačoví vědci, obchodní analytici, správci databází, výzkumníci a statistici.
English Language Requirements
Ověřte svou znalost angličtiny pomocí testu Duolingo English Test! DET je pohodlný, rychlý a cenově dostupný online test angličtiny akceptovaný více než 4 000 univerzitami (jako je tato) po celém světě.