Categorie:
Software de extração de dados /
Scrapinghub Reveja
Excelente | |
Boa | |
Média | |
Mau | |
Horrível |
Transforme sites em dados com os principais serviços e ferramentas de raspagem da Web da Scrapinghub.
Excelente | |
Boa | |
Média | |
Mau | |
Horrível |
· Tento implantar no github, mas posso selecionar apenas meu próprio repositório (Não é possível implantar no repositório da organização?
Não gosto que os números de uso sejam adiados por tantas horas.
usamos scrapinghub para gerar ips proxy para extrair dados da web da empresa e informações da página de carreira. foi muito útil para nos ajudar a criar nosso próprio mecanismo de pesquisa vertical de habilidades.
precisa de muita personalização se os scripts tiverem problemas. no geral, um bom produto para seus casos de uso
O Scrapy é incrível, a API do Python é fácil de usar, o painel do trabalho é fácil de entender, boa documentação e código.
Às vezes, páginas dinâmicas são difíceis de raspar, nada de errado com lua (para splash) como idioma, mas pode ser uma barreira menor à entrada de usuários de python / javascript.
no entanto, é sempre lamentável que seja mais difícil ignorar a detecção de bots, especialmente para sites grandes, como a Amazon, e outros sites protegidos pelo Distil. Eu sei que isso não é culpa do scrapinghub, mas é uma grande dor. e eu sei que você tem um serviço Crawlera para esse fim, mas é bastante caro. por Scrapinghub em 02/01/2019 Obrigado pela sua opinião, agradecemos todos os comentários dos clientes. Concordamos e a pesquisa com antibióticos também é focada em ajudar nossos clientes.
Simplicidade, serviços sem besteira *, serviços modulares e complementos, tempo de inatividade muito baixo. Eu posso continuar e ainda não vou fazer justiça a esses caras
A plataforma de pagamento não era uma caminhada no parque. Os guias e a base de conhecimento não estão desatualizados, mas podem usar uma atualização de 2019
- Funciona perfeitamente desde que você não precise do Portia
- Portia (beta) é quase inutilizável. Consegui alguns programas básicos antes de me ensinar a usar o Scrapy. Ainda assim, se você está procurando um valor e tem tempo para lidar com os atrasos / soluços em Portia, é de longe o melhor valor para um simples ponto e clique na plataforma de raspar que eu encontrei. Você pode fazê-lo funcionar, basta colocar a cabeça na tela antes de terminar ...
Isso realmente economiza meu tempo como especialista em scraping na web. Eu sempre preciso de proxies rotacionados para as necessidades do meu cliente. Continuo criando um novo projeto e é muito trabalhoso ter que comprar proxies, renovar proxies e criar rotação de proxy por conta própria. Fico feliz por não precisar nem pensar nisso. Isso simplesmente funciona!
Bem, simplesmente não há documentação avançada suficiente sobre o Scrapy Splash combinado com o Crawlera. Sua equipe de desenvolvimento no Github é muito receptiva.
O software oferece o resultado exatamente prometido. Possui uma interface amigável e um suporte eficiente.
Você precisa de um roteiro de novos recursos e preços de serviços de terceiros. por Scrapinghub em 02/01/2019 Obrigado pela revisão. Todos os novos recursos serão anunciados em nosso Centro de suporte. (Https://support.scrapinghub.com/support/home) Também temos um Fórum de idéias (https://support.scrapinghub.com/support/discussions/forums/22000200101 ) onde gostaríamos da sua opinião sobre idéias ou novos recursos que você gostaria de ver. Agradecemos todas as informações de nossos clientes para continuar nos ajudando a melhorar nossos produtos.
Foi muito fácil começar a criar rastreadores e iniciá-los no scrapinghub. Plug and play. Pronto para começar a lançar uma frota de rastreadores para mover meu projeto para o próximo nível.
O preço foi um pouco alto para a execução de vários rastreadores.
Estamos muito felizes com o Crawlera. Funciona como um encanto em nossos projetos Scrapy, apenas adicionando algumas linhas de código que esquecemos completamente dos proxies que acabavam falhando de qualquer maneira.
Alguns pedidos acabam sendo muito lentos, mas a boa notícia é que a maioria deles acaba passando.
Código aberto, bem documentado e muito eficiente.
O Splash precisa ser migrado para outra ferramenta IMO. Não acho fácil trabalhar com LUA como desenvolvedor; não por causa do idioma, mas a depuração e manutenção do código é realmente difícil. Se você usa o scrapy-splash, há uma caixa preta com a qual não é possível interagir. Penso que a integração com javascript ou python, enquanto unifica o descarte do navegador e o arranhão, seria uma decisão surpreendente. Então, no geral, eu adoraria ver uma fusão entre o raspador e o raspador de navegador.
No começo, era um pouco complicado automatizar a extração de dados. Depois que comecei a usar o módulo scrapinghub do Python, a vida se tornou fácil. Então também um profissional!
Este software permite acessar 97% dos recursos da web que preciso. Outros servidores proxy que usei me deram 75% no máximo.
Que é uma assinatura com base no tempo. Eu preferiria poder comprar um certo número de solicitações e renovar quando elas acabarem. por Scrapinghub em 02/01/2019 Obrigado por sua análise e sugestões sobre o nosso modelo de preços - agradecemos todos os comentários dos clientes e o encaminhamos para nossa equipe de produtos para análise.
Scrapinghub é tão fácil de usar. Com poucas configurações, você está pronto para construir sua primeira aranha. A integração com o github e outros addons (como crawlera) facilita ainda mais o gerenciamento de implantação de código e gerenciamento de rede proxy. O suporte ao Python 3 também é uma grande melhoria
Ainda estou no início do scrapinghub e, no momento, não havia grandes problemas a serem levados em consideração. Uma coisa que me vem à mente para melhorar é a documentação. por Scrapinghub em 02/01/2019 Obrigado pela sua revisão, agradecemos todos os comentários dos clientes e estamos constantemente procurando uma melhor documentação com melhorias contínuas em andamento. Se houver algum problema em nossa documentação atual, gostaríamos de ouvi-lo. Envie pelo nosso Centro de suporte (https://support.scrapinghub.com/support/home)
Sem contras até agora. De vez em quando, um servidor / IP é banido, mas eles têm um grande conjunto de IPs para atendê-lo.
O limite mensal de solicitações e como não há plano intermediário entre C10 e C50.
Estamos usando o Crawlera apenas para nossas necessidades de coleta de dados e funcionou perfeitamente desde que começamos a usá-lo em 2016. Quando tivemos que atualizar para um limite mais alto, a transição foi rápida e não houve desperdício de tempo atualizando nossa base de código existente.
O preço pode ser um pouco complicado, especialmente se sua necessidade estiver entre os planos.
O hub de raspagem é bastante fácil de usar e se conecta muito bem a qualquer projeto de raspagem que você esteja executando.
O hub de raspagem estava me fornecendo uma quantidade significativa de erros e o hub de raspagem não tem realmente um grande suporte para me ajudar a descobrir o que estava acontecendo.
O melhor para qualquer tipo de necessidade de raspagem. A nova API de raspagem baseada em IA é uma virada no jogo
Nada de ruim nisso. Vence a concorrência fora da água
Uso os serviços Scrapy e Scrapinghub desde 2013 e, até agora, estou muito satisfeito com os serviços deles. Crawlera, seu serviço de proxy, funciona muito bem! Não preciso mais configurar um farm de proxy ou configurar meus raspadores para apontar para milhares de serviços de proxy, pois eles fazem todo o trabalho pesado para você (tudo é automatizado).
Soluços menores de vez em quando no painel. Isso só me afeta quando quero ver estatísticas históricas, mas esse problema não afeta a funcionalidade.
Sua confiabilidade é confiável sobre a lista de IPs de proxy.
Seu método de pagamento apenas aceita cartões de crédito internacionais. Eu usei do Brasil.
Uma plataforma totalmente integrada para uma estrutura bem feita para esse fim. Fácil de usar, com base na estrutura de outras estruturas, por isso, se você está acostumado ao desenvolvimento da Web em python, é fácil criar aranhas. A integração (scrapy + scrapinghub) é realmente boa, desde uma implantação simples até uma biblioteca ou uma janela de encaixe, tornando-a adequada para qualquer necessidade.
Até agora não há nada que eu não goste.
Há muito pouco a reclamar com o Scrapinghub - é realmente um ótimo produto!
Facilidade de uso para baixar e gerenciar vários rastreadores
Dados em excesso que requerem muitas atividades de limpeza. Seria ótimo se os dados pudessem ser limpos e apresentados em formato pronto para uso
Às vezes, a interface do usuário é desajeitada e você não tem certeza se não está interferindo nos raspadores atuais ao editar uma aranha.
- Tecnologia original e flexível
- Não é tão fácil de usar por profissionais de TI não profissionais que ainda desejam usar a raspagem de dados
Como empresa, uma vez atingido um determinado tamanho, faz sentido terceirizar webscraping. O Scrapinghub tem a especialização necessária para fazer um bom trabalho.
Ainda precisa trabalhar do lado do cliente para garantir a qualidade e consistência dos dados. por Scrapinghub em 02/01/2019 Obrigado pela sua opinião, agradecemos todos os comentários dos clientes. Concordamos e a qualidade dos dados também é muito importante para nós. Estamos constantemente buscando melhorar nossa estrutura de controle de qualidade e trabalhando com nossos clientes para garantir uma qualidade consistente dos dados.