Machinelearning
Самая актуальная информация из мира ML, Нейронных сетей,DI
for OCR-free Document Understanding
Мощное мультимодальное семейство больших языковых моделей от Alibaba Group для понимания документов и работы с ними.
• mPLUG-DocOwl1.5 - модель для извлечения единой структуры из документов без распознавания текста.
• TinyChart - SOTA в различных тестах понимания диаграмм, в том числе Chart-to-Text, Chart-to-Table, OpenCQA, and ChartX. TinyChart превосходит несколько MLLM для понимания диаграмм по параметрам до 13B, таких как ChartLlama и ChartAst (код на подходе).
• mPLUG-PaperOwl - научный анализ диаграмм, с помощью мультимодальной LLM.
• UReader - разбор документов с помощью мультимодальной модели большого языка без OCR.
@ai_machinelearning_big_data
🔥🪄 Awesome-LLM: a curated list of Large Language Model
Кураторский список статей, моделей, api, примеров с кодом, курсов, датасетов, посвященный большим языковым моделям.
Это хорошо структурированная академическая подборка.
• Github
Другие узкоспециализированные awesome репозиторий, посвященные LLM:
• Awesome-LLM-hallucination
• Awesome-hallucination-detection
• Awesome ChatGPT Prompts
• Awesome ChatGPT
• Awesome Deliberative Prompting
• Instruction-Tuning-Papers
• LLM Reading List
• Reasoning using Language Models
• Chain-of-Thought Hub
• Awesome GPT
• Awesome GPT-3
• Awesome LLM Human Preference Datasets
• RWKV-howto
• ModelEditingPapers
• Awesome LLM Securityrge
• Awesome-Code-LLM
• Awesome-LLM-Compression
• Awesome-LLM-Systems
• Awesome-LLM-Healthcare
• Awesome-LLM-Inference
• Awesome-LLM-3D
• LLMDatahub
• Language models for Russian language
@ai_machinelearning_big_data
☁️ Stable Diffusion запуск в облаке.
▪ Видео
@ai_machinelearning_big_data
@ai_machinelearning_big_data
OpenBioLLM-Llama3-70B и 8B: самые эффективные и доступные на сегодняшний день Lms в области медицины! 🩺 💊 🧬
Превосходит таких гигантов индустрии, как GPT-4, Gemini, Meditron-70B, Med-PaLM-1 и Med-PaLM-2, в области биомедицины. 🏥 📈 🌟
OpenBioLLM-70B достигает SOTA и является новым достижением для моделей такого размера.
Модель OpenBioLLM-8B превосходит даже GPT-3.5, Gemini и Meditron-70B! 🚀
- 70B : https://huggingface.co/aaditya/OpenBioLLM-Llama3-70B
- 8B : https://huggingface.co/aaditya/OpenBioLLM-Llama3-8B
- Таблица лидеров в области медицины: https://huggingface.co/spaces/openlifescienceai/open_medical_llm_leaderboard
@ai_machinelearning_big_data
Яндекс анонсировал Young Con — фест для студентов и начинающих специалистов, которые интересуются карьерой в IT
Главная тема фестиваля — «Вселенная Яндекса», состоящая из 9 тематических «миров». Участники могут свободно перемещаться по ним и общаться с экспертами, которые поделятся вдохновляющим опытом и расскажут о том, какие возможности предоставляет то или иное IT-направление.
Еще гостей ждет финал «Баттла Вузов» — турнира, в котором студенты будут соревноваться в программировании за призовой фонд в размере 1 млн рублей. В завершение дня выступят группы The Hatters и Хлеб.
Фестиваль пройдет 27 июня в московском Live Arena. Для участия в фестивале нужно зарегистрироваться на сайте Young Con до 14 июня. Гостям достаточно написать мотивационное письмо, а разработчикам — выполнить техническое задание. Специалисты, которые хорошо справятся с тестом, смогут пройти экспресс-собеседование в день фестиваля, которое сильно увеличивает шансы приглашения на стажировку.
Video is too big
Полученные стартапом изображения мгновенно преобразуются в анонимные статистические данные, обрабатываемые локально за 100 мс. Стартап не хранит изображения или личные данные, а только статистические данные.
Кстати, в начале 2024 года корпорация купила стартап WaveOne, который предлагает ИИ-алгоритм для сжатия видео.
@ai_machinelearning_big_data
PyTorch 2.3 is here 😎🔥
Вышел PyTorch 2.3.
В PyTorch 2.3 реализована поддержка пользовательских ядер Triton в torch.compile, что позволяет пользователям переносить свои собственные ядра Triton без снижения производительности или сбоев в графике.
Triton – это языковой компилятор для создания сильно оптимизированных ядер CUDA.
В этом выпуске зафиксировано 3393 изменений.
Полный список обновлений: https://pytorch.org/blog/pytorch2-3/
@ai_machinelearning_big_data