6 livros que todo o cientista de dados deveria ler

A melhor maneira de se manter atualizado e em contato com a evolução do seu mercado é cultivando o conhecimento teórico ao mesmo tempo em que se desenvolve a experiência na prática. Esta combinação de habilidades é crucial e certamente vai ajudá-lo a ter maior sucesso na sua área de atuação.

Para quem trabalha com Data Science não é diferente. Para ser bem sucedido neste meio você precisa estar preparado para passar o tempo fazendo pesquisas e ampliando continuamente o seu conhecimento.

Mesmo exercendo suas atividades práticas no dia a dia é extremamente necessário o estudo para se manter em contato com as tendências atuais.

Embora existam muitos conteúdos disponíveis na Internet, sugerimos especificamente alguns dos melhores materiais impressos lá fora. São eles:
1. Machine Learning Yearning, de Andrew Ng

Este material, desenvolvido pelo Andrew Ng, apresenta por que a Inteligência Artificial, o Machine Learning e o Deep Learning estão efetivamente transformando a industria.

Machine Learning Yearning

2. Hadoop: The Definitive Guide, de Tom White

O Apache Hadoop é o principal framework usado para processar e gerenciar grandes quantidades de dados. Qualquer pessoa que trabalhe com programação ou ciência de dados deve se familiarizar com a plataforma.

Tom White, um consultor Hadoop especialista e membro da Fundação Apache Software, escreveu o guia definitivo repleto de insights e recursos úteis. Mais importante ainda, ele irá acompanhá-lo através de todo o processo de configuração para se trabalhar com Hadoop.

Hadoop: The Definitive Guide

3. Predictive Analytics, de Eric Siegel

Intitulado Predictive Analytics: o poder de prever quem vai clicar, comprar, mentir ou morrer, este livro explica detalhadamente como você pode tratar a maioria das formas de dados e informações, e transformá-los em previsões ou insights acionáveis.

É tarefa de um cientista de dados analisar dados crus e não estruturados e identificar tendências e padrões utilizáveis. Este livro não só irá ajudá-lo a fazer isso, mas também criar os algoritmos preditivos necessários para melhorar as operações e os processos futuros. Considere a Bíblia da análise preditiva.

Predictive Analytics: The Power to Predict Who Will Click, Buy, Lie, or Die
4. Storytelling With Data, por Kole Nussbaumer Knaflic

Storytelling With Data: um guia de visualização de dados para profissionais de negócios é uma leitura crucial para qualquer pessoa no mercado.

O livro trata da organização e extração de grandes quantidades de dados. Isso significa livrar-se de dados excessivos e pouco claros, melhorando os processos de coleta de dados e a experiência na visualizações de dados relevantes e práticos.

É o guia definitivo para aprender o que você deve fazer com todos os dados úteis que você armazena. Muitas das idéias se aplicam à tecnologia em geral, e é útil mesmo para aqueles que estão fora da área de Data Science.

Storytelling With Data
5. Inflection Point, por Scott Stawski

Mais do que apenas um guia teórico, revela sistemas de trabalho reais e descreve como você pode adaptá-los ao seu negócio ou empresa.

A parte importante é que você aprende com o livro, de maneira clara, como implementar ferramentas e plataformas dentro de sua organização.

Inflection Point
6. An Introduction to Statistical Learning with Applications in R, por Gareth James et al.

Aprendizagem estatística e métodos relacionados são necessários para trabalhar com a ciência dos dados. Este livro foi projetado para ajudar a todos os perfis de público, desde em entusiasta ou estudante até um Ph.D.

Também oferece uma ótima seleção de experiências e práticas R, com explicações detalhadas e orientações passo a passo.

An Introduction to Statistical Learning with Applications in R

 

Fonte: Kayla Matthews Para ler mais postagens da Kayla, assine seu blog Productivity Bytes.

Competências essenciais para o cientista de dados e o engenheiro de big data

Dois profissionais estão sendo valorizados nos últimos anos: o cientista de dados e o engenheiro de big data. São duas carreiras que são ligadas à big data e vistas como promissoras. No post anterior foi escrito alguns caminhos e cursos que podem ajudar nessas profissões. Mas será que apenas os cursos bastam?

Vamos falar um pouco de outras competências que são imprescindíveis:

1 – Seja curioso sobre o assunto

Trabalhar com dados exige curiosidade. Não apenas pela parte técnica mas principalmente pelos dados. Não é apenas trabalhar com os dados, mas também entender os dados. Tente extrair o máximo da análise desses dados para que possamos ter mais valor no negócio. Entenda o significado deles, seja curioso.

2 – Entenda o negócio

Para extrair ao máximo dessas informações valiosas que temos, é necessário entender bem o negócio. Por exemplo: se você quer trabalhar com o big data de um banco é necessário entender sobre o mercado financeiro. Assim, você poderá ajudar em uma melhor tomada de decisão.

3 – Converse com todos

Não se prenda apenas ao seu conhecimento. Você nunca será especialista em tudo. Converse com todas as áreas, com o máximo de pessoas possíveis. Troque informações, seja internamente ou seja com clientes/fornecedores etc. Com isso você conseguirá extrair as informações mais importantes de cada pessoa, de cada departamento, de cada área.

4 – Olhe para o oceano de informações

Não utilize apenas as informações que você tem em mãos, mas utilize também as informações e dados que estão surgindo a cada dia, a cada hora, a cada minuto. O mundo está repleto de informações que podem agregar seus dados, inclusive dados públicos. Olhe todos os dados que você tem em mãos, mas também olhe para os dados externos.

5 – Esteja sempre atualizado

Estar atualizado com as ferramentas, técnicas e algoritmos faz muito sentido, mas também vá em eventos, faça networking. A melhor forma de se atualizar é conversar com as pessoas e ver o que os profissionais estão fazendo com os dados. Cursos, matérias, posts são importantes mas o mundo é feito por pessoas. Converse com elas, atualize-se com elas.

6 – Seja inovador

Entender o negócio como vimos é essencial, mas do que adianta se você construir as mesmas informações que o seu concorrente. Pense ‘fora da caixa”, pense diferente, seja inovador.

Post escrito por Alexandre Uehara, Innovation Tech Specialist na Alelo.

Caminhos para se tornar um Cientista de Dados

Que esta é a profissão do futuro já não restam mais dúvidas. Agora quais os primeiros passos para os interessados em se tornar um cientista de dados e como ingressar nesta profissão?
 Sempre associamos a imersão em um novo desafio profissional a elevados investimentos financeiros, mas muitas vezes as alternativas existentes dependem muito mais de tempo e dedicação do que dos recursos financeiros propriamente dito.
Neste sentido separei algumas dicas de cursos (gratuitos e pagos) sobre este tema  para os profissionais interessados em se desenvolver nesta fascinante e exponencial carreira.
A DSA é uma comunidade de especialistas em Ciência de Dados, que tem por objetivo levar treinamento e qualificação profissional em algumas das áreas que mais crescem atualmente. Data ScienceBig Data, Analytics e Internet das Coisas estão demandando profissionais altamente capacitados e a DSA está aí para fornecer treinamento qualificado e diferenciado!
Na Comunidade você encontra desde cursos gratuitos, como o de Fundamentos em Big Data e o de Introdução a Ciência de Dados, até cursos pagos como Formação em Cientista de Dados, Formação em Inteligência Artificial, entre outros.
Confira a lista completa de cursos no site da Data Science Academy.
2 – Udemy
O Udemy é um “marketplace” global para aprendizado on-line com uma extensa biblioteca de mais de 55.000 cursos ministrados por instrutores especializados.  Os preços dos cursos variam bastante, mas existem ótimas opções bem acessíveis como os cursos de Machine Learning e Data Science com Python e Data Science: do Dado à Tomada de Decisão.
3 – IGTI
O Instituto de Gestão e Tecnologia da Informação é um centro de especialização profissional em TI. Fundado em 2006, tem como missão contribuir para o desenvolvimento de competências e conhecimentos em Tecnologia da Informação.
Atualmente consolidado como referência na área e alunos distribuídos em todo o País, a sua reputação é o resultado de uma gestão acadêmica preocupada com a qualidade da educação, um modelo de ensino interativo e inovador, materiais didáticos de qualidade, uma equipe de professores experientes, um eficiente atendimento ao aluno e uma proposta de cursos com enfoque no desenvolvimento de carreiras em TI.
Dentre os cursos de maior aderência aos profissionais/entusiastas da Ciência de Dados destacam-se: MBA em Ciência de Dados (Big Data), MBA em Aprendizado de Máquina (Machine Learning), MBA em Engenharia de Dados e o MBA em Análise de Inteligência de Negócios.
4 –  IBPAD
Instituto Brasileiro de Pesquisa e Análise de Dados é um centro independente de pesquisa e formação de analistas e pesquisadores nas áreas de Pesquisa e Opinião Pública, Política e Relações Governamentais e Comunicação Digital. O foco do Instituto é na aplicação e ensino de técnicas e metodologias de análise de dados com sólida formação científica para atuação no mercado.
Existem ótimas opções e bem acessíveis em cursos como Programação em R, Séries Temporais e Modelos Preditivos. 
5 – Udacity
A Udacity surgiu de uma experiência na Universidade de Stanford. Sebastian Thrun e Peter Norvig ofereceram um curso online gratuito de “Introdução à Inteligência Artificial”, aberto ao público. Foram mais de 160 mil inscritos de 190 países, e logo depois nasceu a Udacity. Hoje é composta por uma equipe cada vez maior de educadores e engenheiros dedicados a mudar o futuro da educação, unindo as competências requisitadas na vida real, uma educação de relevância e empregabilidade.
Existem muitas ótimas opções de cursos na Udacity, porém destaco os seguintes cursos: Fundamentos de Data Science I, Introdução à Análise de Dados, Engenheiro de Machine Learning, Predictive Analytics for Business e o de Fundamentos de Deep Learning.
6 – Coursera
O Coursera proporciona acesso universal à melhor educação do mundo fazendo parcerias com as melhores universidades e organizações para oferecer cursos on-line.
O “cardápio” de opções são inúmeros e podem ser conferidos na lista completa de cursos, porém o destaque vai para o curso de Aprendizagem Automática.
7 – Amazon Web Services (AWS) – Fundamentos da Tecnologia de Big Data
O curso Big Data Technology Fundamentals oferece conhecimentos básicos e gerais sobre as tecnologias usadas em soluções de big data. Ele abrange o desenvolvimento de soluções de big data por meio do uso do ecossistema Hadoop, incluindo MapReduce, HDFS e as estruturas de programação Pig e Hive. Este curso on-line ajuda você a criar uma base para trabalhar com serviços da AWS para soluções de big data. O curso é gratuito e pode ser usado independentemente ou para ajudá-lo a se preparar para o curso Big Data on AWS com instrutor.
O programa apresenta uma visão contemporânea, tanto teórica como prática, que prepara o profissional do marketing no desenvolvimento de pilares fundamentais do marketing analytics, como: o entendimento do ambiente de negócios, gestão de dados e modelagem informacional, análise de redes Sociais, visual information systems, digital analytics, data mining e text Mining, cluster analysis, consumer insights, técnicas integradas de decision support systems. Disciplinas como Geomarketing e Inteligência Geográfica na Tomada de Decisão farão parte da grade.
Este curso de Especialização destina-se a  profissionais com formação em nível superior que atuam na área de Administração de dados e Tecnologia da Informação com interesse em ciência de dados, podendo ser gerentes, especialistas e técnicos. O curso procura abordar problemas inerentes não somente ao contexto de Big Data, mas de dados em geral. Aborda também as tecnologias associadas a Big Data, mostrando para o que servem e diferenças em relação as empregadas em BI. Outro aspecto considerado importante, é cada vez mais dados de indivíduos são disponibilizados e facilmente obtidos na web, é preciso discutir aspectos éticos e legais do uso desses dados.

O curso visa proporcionar aos profissionais capacitação e atualização na área de gerência de grandes volumes de dados, amplamente conhecidos pelos termos Big Data e Data Science. Os conteúdos a serem abordados giram em torno de temas como análise de dados, processamento de grandes volumes de dados, visualização analítica, e computação em nuvem. Além do conhecimento teórico, os egressos do curso irão experimentar as principais ferramentas para lidar com os diversos temas das áreas de Big Data & Data Science.

Big Data e Data Science não são constituídas apenas do agrupamento de um conjunto de tecnologias, mas é a capacidade de conectar não apenas cientistas de dados e tecnólogos, mas profissionais de todas as áreas. Sem dúvida, uma das principais formas de fazer isso é usar métodos avançados de análise de dados e visualizações que não se limitam a mostrar dados, números ou mesmo gráficos, mas que façam todos esses elementos ganharem vida.

Post escrito por Eduardo Prange, CEO da Zeeng.

Cientista de Dados – O profissional do futuro em escassez Global

O desenvolvimento nitidamente acelerado de tecnologias, o acesso democratizado à informação, bem como a possibilidade de conexão entre as pessoas têm demandado das empresas o desenvolvimento de soluções cada vez mais completas aos seus clientes.  Clientes cada vez mais exigentes ganham um protagonismo de escolha jamais vivenciado anteriormente, devido a internet. Tal protagonismo, tem demandado das organizações uma necessidade de entendimento maior sobre seus comportamentos, pois as empresas precisam estar sempre espertas para atender e superar as expectativas do cliente.

A transformação protagonizada pela tecnologia e pelo acesso à informação faz com que usuários conectados à internet gerem diariamente centenas de milhares de dados, que representam o seu comportamento em suas atividades do cotidiano. Toda essa informação pode ser armazenada pelas empresas, pois esses dados, quando bem interpretados, geram um ativo extremamente valioso para as organizações.

Por outro lado, esse ativo tão poderoso e tão cobiçado por diferentes empresas precisa ser analisado a partir de um olhar treinado, que saiba como extrair valor dessas informações. Infelizmente, hoje no mercado faltam profissionais capacitados que consigam melhor traduzir essas informações. A escassez de cientistas de dados não é uma realidade apenas brasileira. A preocupação com a interpretação dessas informações e a iminente falta desses profissionais ultrapassa fronteiras, tomamos o exemplo da gigante do cenário global, a AirBnB, que criou seu próprio curso, para treinar profissionais que possam atender essa demanda.

Diferentes perfis de profissionais podem se tornar um cientista de dados, visto que sua essência está na multidisciplinaridade, pois agrega conhecimentos de computação, matemática, negócios e estatística. Um dos principais desafios desses profissionais é justamente conseguir cruzar essa quantidade de dados e transformar em informação, para uma tomada de decisão mais consciente e baseada em evidências e não somente em feeling.

Post escrito pela Isadora Longo, colaboradora do blog da Zeeng, Consultora de Startups e Mestre em Design Estratégico.