Премиум каналы

Machinelearning

Самая актуальная информация из мира ML, Нейронных сетей,DI

Последние публикации с канала

🌐 The Powerful Multi-modal LLM Family
for OCR-free Document Understanding


Мощное мультимодальное семейство больших языковых моделей от Alibaba Group для понимания документов и работы с ними.

mPLUG-DocOwl1.5 - модель для извлечения единой структуры из документов без распознавания текста.

TinyChart - SOTA в различных тестах понимания диаграмм, в том числе Chart-to-Text, Chart-to-Table, OpenCQA, and ChartX. TinyChart превосходит несколько MLLM для понимания диаграмм по параметрам до 13B, таких как ChartLlama и ChartAst (код на подходе).

mPLUG-PaperOwl - научный анализ диаграмм, с помощью мультимодальной LLM.

UReader - разбор документов с помощью мультимодальной модели большого языка без OCR.

🖥 Github

@ai_machinelearning_big_data

28.04.2024 / 09:04

🔥🪄 Awesome-LLM: a curated list of Large Language Model

Кураторский список статей, моделей, api, примеров с кодом, курсов, датасетов, посвященный большим языковым моделям.

Это хорошо структурированная академическая подборка.

Github

Другие узкоспециализированные awesome репозиторий, посвященные LLM:
Awesome-LLM-hallucination
Awesome-hallucination-detection
Awesome ChatGPT Prompts
Awesome ChatGPT
Awesome Deliberative Prompting
Instruction-Tuning-Papers
LLM Reading List
Reasoning using Language Models
Chain-of-Thought Hub
Awesome GPT
Awesome GPT-3
Awesome LLM Human Preference Datasets
RWKV-howto
ModelEditingPapers
Awesome LLM Securityrge
Awesome-Code-LLM
Awesome-LLM-Compression
Awesome-LLM-Systems
Awesome-LLM-Healthcare
Awesome-LLM-Inference
Awesome-LLM-3D
LLMDatahub
Language models for Russian language

@ai_machinelearning_big_data

27.04.2024 / 12:04

☁️ Stable Diffusion запуск в облаке.

Видео

@ai_machinelearning_big_data

27.04.2024 / 09:04

⚡️ Команда PyTorch разрабатывает библиотеку для обучения LLM под названием torch titan.

Сегодня библиотека стала общедоступной на GitHub, но она все еще находится в предрелизном состоянии и активно разрабатывается.

- Ссылка на библиотеку: https://github.com/pytorch/torchtitan

- Туториал по работе с torch titan: https://www.youtube.com/watch?v=ee5DOEqD35I

Библиотека создана для предварительного обучения моделей, а для файнтюнига у PyTorch есть еще одна библиотека torchtune:
https://github.com/pytorch/torchtune

@ai_machinelearning_big_data

27.04.2024 / 07:04

🔥 Готовится к запуску ИИ-платформа Augment, конкурент GitHub Copilot, с бюджетом в $252 млн

К запуску готовится новая ИИ-платформа Augment. Проект с бюджетом в $252 млн позиционируется как конкурент ИИ-помощника для программистов GitHub Copilot.

В недавнем опросе StackOverflow 44% инженеров-программистов заявили, что они в настоящее время используют инструменты искусственного интеллекта как часть своих процессов разработки, а 26% планируют сделать это в ближайшее время. По оценкам Gartner, более половины организаций тестируют или уже внедрили помощников по кодированию на базе искусственного интеллекта, и что к 2028 году 75% разработчиков будут использовать ИИ для написания кода в той или иной форме.

Экс-разработчик Microsoft Игорь Островский считает, что скоро не останется программиста, который не использует ИИ в своих рабочих процессах. «Разработка программного обеспечения остаётся сложной, зачастую утомительной и разочаровывающей работой, особенно в масштабе больших проектов. ИИ может улучшить качество программного обеспечения, производительность команды и помочь вернуть радость от программирования», — рассказал Островский TechCrunch.

Островский решил создать удобную ИИ-платформа Augment, которую он сам хотел бы использовать. Это платформа Augment, которая ранее получила финансирование в размере $252 млн. Благодаря инвестициям бывшего генерального директора Google Эрика Шмидта и венчурных капиталистов, включая Index Ventures, Sutter Hill Ventures, Lightspeed Venture Partners, Innovation Endeavors и Meritech Capital, Augment стремится встряхнуть все ещё зарождающийся рынок технологий генеративного ИИ-кодинга.

▶️ Записаться в white-лист для тестирования Augment

@ai_machinelearning_big_data

26.04.2024 / 16:04

OpenBioLLM-Llama3-70B и 8B: Open-source Large Language Models in Medical Domain

OpenBioLLM-Llama3-70B и 8B: самые эффективные и доступные на сегодняшний день Lms в области медицины! 🩺 💊 🧬

Превосходит таких гигантов индустрии, как GPT-4, Gemini, Meditron-70B, Med-PaLM-1 и Med-PaLM-2, в области биомедицины. 🏥 📈 🌟

OpenBioLLM-70B достигает SOTA и является новым достижением для моделей такого размера.
Модель OpenBioLLM-8B превосходит даже GPT-3.5, Gemini и Meditron-70B! 🚀

- 70B : https://huggingface.co/aaditya/OpenBioLLM-Llama3-70B
- 8B : https://huggingface.co/aaditya/OpenBioLLM-Llama3-8B
- Таблица лидеров в области медицины: https://huggingface.co/spaces/openlifescienceai/open_medical_llm_leaderboard

@ai_machinelearning_big_data

26.04.2024 / 07:04

⚡️ UniMERNet: A Universal Network for Real-World Mathematical Expression Recognition

Модель распознавания математических выражений (MER).

git clone https://github.com/opendatalab/UniMERNet.git

Github: https://github.com/opendatalab/unimernet
Paper: https://arxiv.org/abs/2404.15254
HF: https://huggingface.co/wanderkid/unimernet

@ai_machinelearning_big_data

25.04.2024 / 19:04

Яндекс анонсировал Young Con — фест для студентов и начинающих специалистов, которые интересуются карьерой в IT

Главная тема фестиваля — «Вселенная Яндекса», состоящая из 9 тематических «миров». Участники могут свободно перемещаться по ним и общаться с экспертами, которые поделятся вдохновляющим опытом и расскажут о том, какие возможности предоставляет то или иное IT-направление.

Еще гостей ждет финал «Баттла Вузов» — турнира, в котором студенты будут соревноваться в программировании за призовой фонд в размере 1 млн рублей. В завершение дня выступят группы The Hatters и Хлеб.

Фестиваль пройдет 27 июня в московском Live Arena. Для участия в фестивале нужно зарегистрироваться на сайте Young Con до 14 июня. Гостям достаточно написать мотивационное письмо, а разработчикам — выполнить техническое задание. Специалисты, которые хорошо справятся с тестом, смогут пройти экспресс-собеседование в день фестиваля, которое сильно увеличивает шансы приглашения на стажировку.

25.04.2024 / 17:04

🔥 FlowMap: High-Quality Camera Poses, Intrinsics, and Depth via Gradient Descent

Массачусетский технологический университет представил FlowMap.

Это новый комплексный дифференцируемый метод для реконструкции 3D сцены, который позволяет точно задать ракурсы камеры, характеристики движения и глубину видеоряда для каждого кадра.

FlowMap позволяет создавать реалистичные ракурсы на 360°.

Github: https://github.com/dcharatan/flowmap
Paper: https://arxiv.org/abs/2404.15259
Dataset: https://drive.google.com/drive/folders/1PqByQSfzyLjfdZZDwn6RXIECso7WB9IY

@ai_machinelearning_big_data

Video is too big
25.04.2024 / 10:04

📌Apple приобрела компанию Datakalab, занимающуюся проектами на базе ИИ

🟡Apple купила французский стартап Datakalab, который специализируется на технологиях сжатия данных искусственного интеллекта и компьютерного зрения.

🟡Datakalab позиционирует себя как «эксперта в области маломощных эффективных алгоритмов глубокого обучения», работающих на устройствах. Стартап создаёт алгоритмы для анализа изображений и видео. Один из продуктов компании — инструмент для отслеживания наличия масок на лицах пассажиров общественного транспорта Парижа.
Полученные стартапом изображения мгновенно преобразуются в анонимные статистические данные, обрабатываемые локально за 100 мс. Стартап не хранит изображения или личные данные, а только статистические данные.

🟡Datakalab имеет несколько патентов, связанных с технологиями сжатия данных ИИ и машинного зрения.

🟡Приобретение стартапа, вероятно, обусловлено планами Apple предоставить набор ИИ-функций в iOS 18. Datakalab разработала передовую технологию на базе машинного обучения, которая может сыграть роль в развитии гарнитуры смешанной реальности Vision Pro.
Кстати, в начале 2024 года корпорация купила стартап WaveOne, который предлагает ИИ-алгоритм для сжатия видео.

@ai_machinelearning_big_data

25.04.2024 / 08:04

PyTorch 2.3 is here 😎🔥

Вышел PyTorch 2.3
.

В PyTorch 2.3 реализована поддержка пользовательских ядер Triton в torch.compile, что позволяет пользователям переносить свои собственные ядра Triton без снижения производительности или сбоев в графике.

Triton – это языковой компилятор для создания сильно оптимизированных ядер CUDA.

В этом выпуске зафиксировано 3393 изменений.

Полный список обновлений: https://pytorch.org/blog/pytorch2-3/

@ai_machinelearning_big_data

24.04.2024 / 18:04
Отзывы: - 0
Поделитесь вашим мнением! Оставьте отзыв:

Похожие

Избранное