Categorie: Big Data Software / Software de análise de dados / Bancos de dados Reveja

Bancos de dados

Avaliações: 7 | Classificação geral: Boa
Excelente
5
Boa
2
Média
0
Mau
0
Horrível
0
Plataforma de análise baseada em nuvem para equipes de ciência de dados que facilita o processamento e a visualização de grandes dados.
Comentário deixado em 03/29/2020
Cinderella Paillet

Muito bom. Tornou a análise de big data muito mais fácil

Este produto democratizou a computação de big data. É muito fácil mudar de qualquer plataforma para este produto, pois suporta a maioria dos idiomas.

Até agora, o custo da computação pode melhorar com o tempo, mas ainda é um produto econômico para desenvolver recursos internos de big data.
Comentário deixado em 03/21/2020
Gardel

Gosto da página do portal, que conecta todas as assinaturas do Azure.

Pode ser difícil de entender e não há muito tutorial disponível.
Comentário deixado em 11/22/2019
Feldman

O Databricks está permitindo a análise de dados que outros sistemas não poderiam executar com o mesmo desempenho, porque é uma plataforma que integra grandes quantidades de dados da nuvem aos notebooks Scala, Python, SQL ou R em uma interface amigável. Devido aos recursos do Databricks, o trabalho diário parece mais eficiente e menos burocrático.

O que eu mais gosto no Databricks é a quantidade de integrações que a plataforma fornece ao usuário. Com o Databricks, você pode criar conjuntos de dados, desenvolver modelos de aprendizado de máquina e analisar o desempenho automaticamente, configurando um trabalho periodicamente. Seja o usuário engenheiro, cientista de dados ou analista de negócios, o Databricks pode otimizar o trabalho de todos.

O que eu menos gosto no Databricks é a instabilidade que geralmente ocorre quando há muitos usuários tentando executar seus notebooks no mesmo cluster ao mesmo tempo.
Comentário deixado em 09/30/2019
Tomlinson

O Databricks foi escolhido como parte de uma nova plataforma de dados baseada em nuvem. O envolvimento da empresa poderia ser melhor, no entanto, o produto em si faz o trabalho

Interface de usuário fácil de usar

As considerações sobre segurança da informação devem ser levadas em consideração devido à necessidade de integrações com VPCs de banco de dados quando hospedadas na AWS
Comentário deixado em 09/01/2019
Alton

No geral, minha experiência com o Databricks foi muito positiva. É uma ferramenta poderosa para habilitar cientistas de dados sem muitas habilidades de engenharia de dados. No entanto, você precisa ser um cientista de dados ou engenheiro de aprendizado de máquina para poder tirar proveito de seu poder de aprendizado de máquina.

Eu amo como é fácil implantar modelos de aprendizado de máquina com dimensionamento automático. Depois que um modelo de aprendizado de máquina é treinado, você pode simplesmente clicar em um botão para implantar o modelo, acredito em um contêiner, e fazer a escala automática conforme necessário. Você também pode especificar o tamanho mínimo e máximo da implantação para reduzir custos, mas acompanhar a carga de trabalho conforme necessário. Também é construído em torno do Spark, portanto, as tarefas que envolvem "big data" não são um problema.

Alguns dos contras são que a linguagem principal é Java / Scala, enquanto muitos cientistas de dados estão usando python ou R, que são mais lentos nos Databricks do que Java e Scala. Além disso, a interface principal via codificação, que pode limitar muitos cientistas de dados do cidadão.
Comentário deixado em 07/23/2019
Farlee

Eu sou uma pessoa SQL, portanto, poder executar análises de big data na minha linguagem preferida foi bastante bom. Ser capaz de (quase) trocar perfeitamente entre Scala, SQL e python no mesmo script é bastante poderoso. Se você não sabe fazer algo facilmente em um idioma, faça-o em outro e depois troque de volta. É de alto desempenho e consulta de dados não indexados despejados dos sistemas de origem, mesmo que esses conjuntos de dados não sejam "big data". Achei mais rápido despejar 100mil linhas de data em etapas do nosso servidor local para o data lake e processá-lo no Databricks do que era executado no SQL.

Eu não estava envolvido no preço, mas pelo que entendi é bastante caro. Os clusters podem ser girados para cima ou para baixo, conforme necessário, e há um bom recurso de desligamento por inatividade se você esquecer de desativar um cluster de teste ou algo assim. Também tive um tempo bastante difícil para conectar um Data Lake do Azure Gen 2, mas depois de encontrar o bug não tão bem documentado, não foi grande coisa.
Comentário deixado em 02/25/2019
Par

Excelente. Muito rápido e fácil de usar. Também é fácil obter ajuda na documentação. Sem atrasos e suporta um grande número de usuários.

O acesso e manipulação de dados. O software é muito rápido e ótimo para manipular e tratar dados. Também é possível construir modelos.

A falta de opções de visualização e criação de painéis.

Deixe um comentário para Bancos de dados