Webscraper.io
Автоматизированный инструмент для сбора web-данных. Справляется с данными динамических форм, способен выгружать информацию в разных форматах.
Сайт сервиса: https://webscraper.io
Автоматизированный инструмент для сбора web-данных. Справляется с данными динамических форм, способен выгружать информацию в разных форматах.
Сайт сервиса: https://webscraper.io
Инструмент предназначен для решения целого спектра разных задач, связанных с подготовкой, очисткой и обогащением данных, в частности отлично справляется с задачей анонимизации персональных данных.
Обладает широким набором функций визуализации обрабатываемых данных, позволяет записывать сценарии для последующего воспроизведения. Предоставляется на основании коммерческой и свободной лицензии. Существует разница в функционале между типами версий.
Инструментальный набор для очистки и преобразования данных от Стендфордского университета. Функционал близок к инструменту Talend Data Preparation.
Сайт сервиса: http://vis.stanford.edu/wrangler
Программное обеспечение для обработки и подготовки данных к анализу.
Сайт сервиса: https://www.trifacta.com
Инструмент для работы с сырыми данными: преобразование в разные форматы, очистка, расширение.
Сайт сервиса: http://openrefine.org
Широко известные табличные процессоры, предназначенные для хранения, обработки, вычислений и визуализации табличных данных. Могут, за счёт встроенных средств разработки сценариев, использоваться для решения таких задач, как:
Обладают встроенной справкой на русском языке.
Сайты:
Простая система класса BI, предназначенная для визуализации и анализа слабоструктурированных данных с открытым исходным кодом. Кроме свободной лицензии, предоставляется лицензия класса enterprise.
Для работы использует так называемую in-memory базу данных H2, которую не рекомендуется использовать для промышленной эксплуатации, для которой можно использовать MySQL ( MariaDB ) или PostgreSQL.
Методические рекомендации по работе с продуктом: https://docs.google.com/document/d/1gSiGvUNxmUHg Ps6WjvEtjotV5bhmBkVqIkblNxQOn10
Платформа разработки аналитики, построенная на базе ассоциативного движка и библиотек.
Сайт сервиса: https://www.qlik.com
Инструмент для визуального анализа, позволяющий осуществлять динамическую фильтрацию данных, выделять тренды или проводить глубинный когортный анализ.
Сайт сервиса: http://tableau.com
Комплексное программное обеспечение бизнесанализа компании Microsoft, объединяющее несколько программных продуктов.
Сайт сервиса: https://powerbi.microsoft.com
Инструмент, который даёт маркетологам простые средства для визуализации данных, полученных из разных источников.
Сайт сервиса: https://datastudio.google.com
Веб-сервис для создания инфографики, онлайнкарт и интерактивных схем.
Сайт сервиса: https://infogram.com
Программное обеспечение с открытым кодом для анализа и визуализации графов.
Сайт сервиса: https://gephi.org
JavaScript-библиотека для создания статичных и интерактивных визуализаций сложных данных.
Сайт сервиса: https://d3js.org
Средство контейнерной виртуализации вычислений Docker будет полезным для упрощения задачи развёртывания сред прототипирования под различные задачи моделирования данных. в частности, некоторые из приводимых в настоящем параграфе инструментов великолепно упаковываются с его помощью ( для некоторых из них существуют официальные образы, поставляемые разработчиками продуктов ):
Существует официальный репозиторий контейнеров для использования в составе ваших решений Docker Hub ( https://hub.docker.com/ )
Flask — программный каркас для разработки вебприложений на языке Python, использующий набор инструментов Werkzeug и Jinja2. Предоставляет только базовые возможности для разработки.
Сайт среды: https://flask.palletsprojects.com/
Интерактивное средство разработки для Python и некоторых других языков, позволяющее создавать интерактивные приложения и комбинировать их с презентационными текстами, диаграммами и данными. Можно воспользоваться как предоставляемым разработчиком среды сервисом, так и развернуть его на своих площадях. Запуск проектов Jupyter Notebook обеспечивает среда JupyterLab, к которой можно подключать все необходимые в работе библиотеки и сервисы.
Сайт среды: https://jupyter.org/
Программный каркас для решения задач машинного обучения от Google на языке программирования Python, имеющий широкое распространение в мире. Содержит в себе широкий набор инструментов моделирования и визуализации данных. Предназначен для использования профессионалами в области разработки и машинного обучения.
Сайт среды: https://www.tensorflow.org
Онлайн-сервис, предназначенный для создания, редактирования и публикации карт.
Сайт сервиса: https://www.mapbox.com
Некоммерческий веб-картографический проект по созданию силами сообщества участников — пользователей Интернета подробной свободной и бесплатной географической карты мира.
Сайт сервиса: https://www.openstreetmap.org
Сервис Яндекс, позволяющий для заданного слова или словосочетания находить релевантные этому словосочетанию запросы к поисковому сервису Яндекс. Сервис позволяет эффективно решать задачи микро-таргетинга в маркетинге, когда существует необходимость более чётко определить образ целевой аудитории.
Сайт сервиса: https://wordstat.yandex.ru/
Очень компактный SQL-сервер, используемый, как правило, для внедрения в более крупные прикладные разработки. в частности, может оказать неоценимую помощь, когда существует необходимость развернуть компактную базу данных в рамках мобильного приложения. Часто применяется для хранения журналов приложений или подготовки тестовых данных для последующего обучения модели.
Сервис, предоставляющий доступ к уже подготовленным моделям русского языка в форматах word2vec, позволяющих ускорить подготовку моделей машинного обучения для обработки текстов на живом русском языке.
Сайт сервиса: https://rusvectores.org/ru/models/