ai_machinelearning_big_data | Технологии

Telegram-канал ai_machinelearning_big_data - Machinelearning

27349

Самая актуальная информация из мира ML, Нейронных сетей,DI По всем вопросам- @haarrp @itchannels_telegram - 🔥 best it channels @pythonl - 🐍 @machinee_learning -chat @ArtificialIntelligencedl - AI @datascienceiot - ml 📚 @machinelearning_ru ml

Подписаться на канал

Machinelearning

🔥 Подборка каналов для Дата сайентиста

🖥 Machine learning

datasc - Data science в телеграм!
@bigdatai - Big Data

@machinelearning_ru – гайды по машинному обучению
@machinelearning_interview – подготовка к собеседованию мл.
@datascienceiot – бесплатные книги ds
@ArtificialIntelligencedl – ИИ

@machinee_learning – чат о машинном обучении
@datascienceml_jobs - вакансии ds, ml
@Machinelearning_Jobs - чат с вакансиями

#️⃣ c# c++
C# - погружение в C#
@csharp_cplus чат
С++ - обучающий канал по C++.
@csharp_1001_notes - инструменты C#

🖥 SQL базы данных

@sqlhub - Повышение эффективности кода с грамотным использованием бд.
@chat_sql - чат изучения бд.

👣 Golang
@Golang_google - восхитительный язык от Google, мощный и перспективный.
@golang_interview - вопросы и ответы с собеседований по Go. Для всех уровней разработчиков.
@golangtests - интересные тесты и задачи GO
@golangl - чат изучающих Go
@GolangJobsit - отборные вакансии и работа GO
@golang_jobsgo - чат для ищущих работу.
@golang_books - полезные книги Golang
@golang_speak - обсуждение языка Go
@golangnewss - новости go

🖥 Linux
linux - kali linux ос для хакинга
linux chat - чат linux для обучения и помощи.
@linux_read - бесплатные книги linux

🖥 Python

@pythonl - главный канал самого популярного языка программирования.
@pro_python_code – учим python с ментором.
@python_job_interview – подготовка к Python собеседованию.
@python_testit - проверочные тесты на python
@pythonlbooks - современные книги Python
@python_djangojobs - работа для Python программистов
@python_django_work - чат обсуждения вакансий

🖥 Javascript / front

@react_tg - - 40,14% разработчиков сайтов использовали React в 2022 году - это самая популярная библиотека для создания сайтов.
@javascript -канал для JS и FrontEnd разработчиков. Лучшие практики и примеры кода. Туториалы и фишки JS
@Js Tests - каверзные тесты JS
@hashdev - погружение в web разработку.
@javascriptjobjs - отборные вакансии и работа FrontEnd.
@jsspeak - чат поиска FrontEnd работы.

🖥 Java
@javatg - выучить Java с senior разработчиком на практике
@javachats - чат для ответов на вопросы по Java
@java_library - библиотека книг Java
@android_its - Android разработка
@java_quizes - тесты Java
@Java_workit - работа Java
@progersit - шпаргалки ит

👷‍♂️ IT работа

/channel/addlist/_zyy_jQ_QUsyM2Vi -ит каналы по яп с вакансиями

🤡It memes
@memes_prog - ит-мемы

⚙️ Rust
@rust_code - Rust избавлен от болевых точек, которые есть во многих современных яп
@rust_chats - чат rust

📓 Книги

/channel/addlist/HwywK4fErd8wYzQy - актуальные книги по всем яп

⭐️ Нейронные сети
@vistehno - chatgpt ведет блог, решает любые задачи и отвечает на любые ваши вопросы.
@aigen - сети для генерации картинок. видео, музыки и многого другого.
@neural – погружение в нейросети.

📢 English for coders

@english_forprogrammers - Английский для программистов

🖥 Devops
Devops - канал для DevOps специалистов.

Читать полностью…

Machinelearning

21 Must-Have Cheat Sheets for Data Science Interviews: Unlocking Your Path to Success

Список полезных шпаргалок для подготовки к собеседованию по Data Science

SQL

1. SQL Basics Cheat Sheet
2. The Essential SQL Commands Cheat Sheet for Beginners
3. SQL Cheat Sheet – Technical Concepts for the Job Interview

Python

4. Python Cheat Sheet
5. Python Cheat Sheet
6. Comprehensive Python Cheatsheet

R

7. RStudio Cheatsheets

Data Structures

8. Data Structures Reference
9. An Executable Data Structures Cheat Sheet for Interviews

Data Manipulation

10. Pandas Cheat Sheet for Data Science
11. Pandas Cheat Sheet
12. Data Wrangling With pandas Cheat Sheet

Data Visualization

13. Data Visualization Cheat Sheet
14. Data Visualization Cheat Sheet
15. Data Visualization Cheat Sheets

Statistics & Probability

16. A Comprehensive Statistics Cheat Sheet for Data Science Interviews
17. The Most Comprehensive Stats Cheat Sheet
18. Statistics Cheat Sheet

Algorithms & Models

19. Top Prediction Algorithms
20. Your Ultimate Data Science Statistics & Mathematics Cheat Sheet
21. Cheat Sheet for Machine Learning Models

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🧔 4DHumans: Reconstructing and Tracking Humans with Transformers

Fully "transformerized" version of a network for human mesh recovery.

Высокоточная модель реконструкции и отслеживания человека в 3D.


🖥 Github: https://github.com/shubham-goel/4D-Humans

⭐️ Colab: https://colab.research.google.com/drive/1Ex4gE5v1bPR3evfhtG7sDHxQGsWwNwby?usp=sharing

📕 Paper: https://arxiv.org/pdf/2305.20091.pdf

🔗 Project: https://shubham-goel.github.io/4dhumans/

ai_machinelearning_big_data

Читать полностью…

Machinelearning

Ищу ml специалиста для разработки быстрой, эффективной системе трекинга движений человека в реальном времени

Мы компания metadreamteam.io - амбициозная команда XR разработчиков и 3Д артистов, работающая на американском рынке, которая делает проекты для всего мира! От Екомерс до real estate. От внедрения лучших решений на рынке до создания своих разработок с нуля.

Сейчас делаем свою разработку по созданию умного зеркала для примерки одежды.

Необходимо разработать систему трекинга на основании данных с rgb потока камеры , включающую от 8 основных точек скелета их положение и вращение с минимальной возможной погрешностью. Нужно выбрать архитектуру, спрогнозировать обьем базы данных, аппаратные мощности для обучения и работы нейросети. И создать ее обосновав решение

Работа удаленная. Фриланс. Оплата от $40 в час

Если ты хочешь работать с лучшими в индустрии, делать амбициозные проекты и зарабатывать в валюте - тогда заполняй эту форму, чтобы присоединиться к нам! - https://forms.gle/JkFgki9dNCggkz5PA

Читать полностью…

Machinelearning

Топ-210 технологических решений представили на фестивале «Лидеры цифровой трансформации»

Мероприятие стало финалом самого масштабного одноименного хакатона. ИТ-специалисты со всего мира вышли в офлайн, чтобы представить свои разработки для города и бизнеса. 210 команд ждут итоги и уже завтра жюри назовут имена победителей.

Центральной локацией фестиваля стал брендированный корнер Tada․team с интерактивными задачами и лаунж-зоной. Участники могут выиграть мерч, пройдя квест, сканируя qr-код и запуская приложение чат-бота «История технологий».

Сегодня на сцене выступили научно-популярные спикеры, которые рассказали участникам о последних трендах в ИТ, о квантовых информационных технологиях, эволюции мозга, инновациях в персональных ДНК-тестах и синтетическом дизайне как инструменте для стартапов. Завершился день концертом от 4NN4 (экс- Cream Soda) и группы «Винтаж».

Читать полностью…

Machinelearning

🐼 PandaLM: ReProducible and Automated Language Model Assessment

Judge large language model, named PandaLM, which is trained to distinguish the superior model given several LLMs. PandaLM's focus extends beyond just the objective correctness of responses, which is the main focus of traditional evaluation datasets.

PandaLM - обеспечивает автоматизированные сравнения между различными большими языковыми моделями (LLM). Задавая одинаковый контекст, PandaLM может сравнивать ответы различных LLM и предоставлять причину решения вместе с эталонным ответом.


🖥 Github: https://github.com/weopenml/pandalm

📕 Paper: https://arxiv.org/abs/2306.05087v1

🔗 Dataset: https://github.com/tatsu-lab/stanford_alpaca#data-release

ai_machinelearning_big_data

Читать полностью…

Machinelearning

⚠️Пройдите тест на углубленные знания в сфере Machine Learning. Professional

🔓 Ответьте на 10 вопросов и проверьте, насколько вы готовы к обучению на продвинутом курсе «Machine Learning. Professional» от OTUS и его партнера — Сбера.

⏰ Время прохождения теста ограничено 30 минут

👉 ПРОЙТИ ТЕСТ: https://otus.pw/vMDX/

Присоединяйтесь 15 июня в 18:00 мск к открытому уроку. На вебинаре «Content-based рекомендательные системы» вы:

— Узнаете общие принципы построения рекомендательных систем

— Познакомитесь с методами контентной фильтрации

— Построите свою первую рекомендательную систему для онлайн-магазина.

Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963. 2RanynG9KRz

Читать полностью…

Machinelearning

⚡️ Стартовал прием заявок на Технологический конкурс НТИ Up Great «Экстренный поиск»!

Участникам предстоит преодолеть комплексный технологический барьер, предусматривающий разработку технологий и технических решений, объединенных в единую систему, позволяющую эффективно использовать техническое зрение при поиске пропавших людей с применением беспилотных воздушных судов (БВС).

На первом этапе (Сателлит №1) участникам необходимо разработать программное решение для поиска объектов (людей) на изображениях, полученных с БВС. 

Призовой фонд Сателлита №1 составляет 5 млн руб. 
Лучшим командам, удовлетворяющим требованиям технического регламента, организаторами будут предоставлены БВС для участия во втором этапе (Сателлит №2) и финале конкурса.

Призерами и победителями могут стать только налоговые резиденты РФ.

📲 Заявки на Сателлит № 1 принимаются до 12 июня 2023 г. по ссылке.

Конкурс организуется совместно МФТИ, Фондом НТИ и добровольческим поисково-спасательным отрядом «ЛизаАлерт». Общий призовой фонд составляет 135 млн руб.

Читать полностью…

Machinelearning

🔭 GRES: Generalized Referring Expression Segmentation

New benchmark (GRES), which extends the classic RES to allow expressions to refer to an arbitrary number of target objects.

Новый метод
и датасет расширяющий классический RES, который принимает изображение и тектовое описание в качестве входных данных для сегментации и обнаружения множественных объектов.

🖥 Github: https://github.com/henghuiding/ReLA

Paper: https://arxiv.org/abs/2306.00968

🔎 Project: https://henghuiding.github.io/GRES/

📌 New dataset: https://github.com/henghuiding/gRefCOCO

ai_machinelearning_big_data

Читать полностью…

Machinelearning

Generative AI learning path

This learning path guides you through a curated collection of content on Generative AI products and technologies.

10 бесплатных курсов от Googel, которые помогут вам погрузиться в технологии генеративного ИИ: от основ больших языковых моделей до создания и развертывания решений генеративного ИИ в Google Cloud.

Introduction to Generative AI

Introduction to Large Language Models

Introduction to Responsible AI

Introduction to Image Generation

Encoder-Decoder Architecture

Attention Mechanism

Transformer Models and BERT Model

Create Image Captioning Models

Introduction to Generative AI Studio

Generative AI Explorer - Vertex AI

https://www.cloudskillsboost.google/paths/118

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🔥 Подборка полезных папок с каналами для датасаентисов

Папки, где вы найдете каналы с разбором лучших практик написания кода на Python и Golang до каналов по машинному обучению и нейросетям (папки работают на последних версиях тг).

/channel/addlist/2Ls-snqEeytkMDgy - Машинное обучение

/channel/addlist/8vDUwYRGujRmZjFi - Python

/channel/addlist/MUtJEeJSxeY2YTFi - Golang

Читать полностью…

Machinelearning

Positive Hack Days, новые железки и покупки

Новое видео на YouTube-канале Yandex Cloud 😎

Вместе с гостями из «ЛитРес», EORA и архитектором Yandex Cloud Евгением Парфёновым обсуждаем много интересного в регулярном выпуске Monthly Cloud News Maу:

— форум по кибербезопасности Positive Hack Days;
— сделку Microsoft и Activision Blizzard;
— сканер уязвимости контейнерных образов;
— историю DNS и лазейки в WAF;
— повседневные новости Yandex DataSphere и Yandex SpeechKit.

Хотите узнать больше? Смотрите видео и делитесь им с друзьями 😉

Читать полностью…

Machinelearning

В последнее время только и разговоров, что о нейросетях. Кто-то боится, что AI заберёт у них работу, а кто-то с его помощью повышают свою эффективность. Каждый, кто использует нейронки, уже немного приблизился к новой профессии. Мы ещё не знаем, как она будет называться. Но никто не мешает проявить фантазию: лид продуктового направления по ML ВКонтакте Иван Самсонов дал ей кодовое название — погонщик нейросетей.

Заглядывайте в статью и узнайте, как поймать волну перемен: вас ждёт большая подборка инструментов и небольшой туториал, как уже сейчас можно использовать их в работе.

📌Хабр: https://habr.com/ru/companies/vk/articles/738776/

ai_machinelearning_big_data

Читать полностью…

Machinelearning

Платформа Sber Process Mining заменит иностранную процессную аналитику для внутреннего аудита X5 Group. Процесс перехода уже состоялся и специалисты X5 продолжат автоматизировать проверки соответствия бизнес-процессов установленным нормативам и тестирование контрольных процедур на российском программном обеспечении.

Плюсы от перехода на платформу Sber Process Mining для X5 Group:
✅Отечественное ПО — снижение зависимости от западных вендоров
✅Сохранение возможности регулярного тестирования контрольных процедур на больших объемах данных
✅Быстрый поиск отклонений и нарушений, в том числе недоступных для выявления традиционными средствами
✅Встроенные инструменты машинного обучения
✅ Может применяться для оптимизации любых процессов с цифровыми следами

«Мы гордимся нашим сотрудничеством с X5 Group. Это отличный пример синергии, которая позволила нам совместно решить амбициозную задачу по вендерозамещению решения от лидера мирового рынка. Глубокая экспертиза коллег и качественная обратная связь позволили нам вывести платформу Sber Process Mining на уровень лучших мировых практик», — заявил вице-президент Сбера Тарас Скворцов.

Подробности:
https://platformv.sber.ru/products/sber-process-mining

Читать полностью…

Machinelearning

Хотите работать ML-инженером в Тинькофф, Яндекс, ВКонтакте, Ozon или другой крупной IT-компании?

Освоить всю необходимую базу для получения оффера можно за 7 месяцев на курсе Start ML.

Вы на практике узнаете как ML-алгоритмы работают под капотом, научитесь обучать
модели и нейронные сети, а также оценивать их влияние на бизнес и продукт с помощью статистики и A/B-тестов — всё под руководством опытных специалистов из Райффайзен и Яндекс.

Курс даст всё необходимое, чтобы уверенно пройти собеседование на позицию Junior ML-специалиста и уже с первых дней быстро расти и приносить компании пользу. С поиском вакансий и трудоустройством обязательно поможем.

Новый поток стартует уже 8 июня, а по промокоду MLBIGDATA21 для вас действует скидка 5%. Присоединяйтесь!

[Зарегистрироваться]

Читать полностью…

Machinelearning

Macaw-LLM: Multi-Modal Language Modeling with Image, Audio, Video, and Text Integration

Macaw-LLM is a model of its kind, bringing together state-of-the-art models for processing visual, auditory, and textual information, namely CLIP, Whisper, and LLaMA.

Macaw-LLM - новый мультимодальный LLM, который легко объединяет визуальную, аудио и текстовую информацию. Модель построена на основе CLIP, Whisper и LLaMA и обеспечивает бесшовную интеграцию мультимодальных данных.

🖥 Github: https://github.com/lyuchenyang/macaw-llm

⭐️ Model: https://tinyurl.com/yem9m4nf

📕 Paper: https://tinyurl.com/4rsexudv

🔗 Dataset: https://github.com/lyuchenyang/Macaw-LLM/blob/main/data

ai_machinelearning_big_data

Читать полностью…

Machinelearning

Новая программная библиотека от Сбера Py-Boost позволит в несколько раз повысить скорость разработки моделей машинного обучения. Использоваться для этого будет алгоритм SketchBoost, рассказал Александр Ведяхин, первый зампред правления Сбера, в рамках ПМЭФ.

SketchBoost реализует новый подход к использованию методов бустинга при обучении ИИ-моделей — он применяется также в финансах и страховании для решения B2B-задач.

«Совершенствование технологий на базе машинного обучения — это не только тренд, но и способ повысить качество контакта с клиентом, возможность подобрать именно тот продукт, который максимально отвечает его предпочтениям. Для этого мы представили алгоритм, который в разы ускоряет обучение моделей искусственного интеллекта и, как следствие, вывод на рынок разработок в области рекомендательных сервисов в сфере финансов и страхования», — подчеркнул Ведяхин.

GitHub
Sber Developers

ai_machinelearning_big_data

Читать полностью…

Machinelearning

💲 FinGPT: Open-Source Financial Large Language Models

Unlike proprietary models, FinGPT takes a data-centric approach, providing researchers and practitioners with accessible and transparent resources to develop their FinLLMs.

Большая языковая модель с открытым исходным кодом FinGPT для финансового сектор. Полный пайплайн для обучения и доработки LLM в области финансов.

🖥 Github: https://github.com/ai4finance-foundation/fingpt

⭐️ FinNLP: https://github.com/ai4finance-foundation/finnlp

📕 Paper: https://arxiv.org/abs/2306.06031v1

🔗 Project: https://ai4finance-foundation.github.io/FinNLP/

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🏔️ Large Language Model for Geoscience

We introduce K2 (7B), an open-source language model trained by firstly further pretraining LLaMA on collected and cleaned geoscience literature, including geoscience open-access papers and Wikipedia pages, and secondly fine-tuning with knowledge-intensive instruction tuning data (GeoSignal).

Применение базовой языковой модели для понимания и использования знаний в области геонаук

git clone https://github.com/davendw49/k2.git
cd k2
conda env create -f k2.yml
conda activate k2


🖥 Github: https://github.com/davendw49/k2

⭐️ Demo: https://huggingface.co/daven3/k2_fp_delta

📕 Paper: https://arxiv.org/abs/2306.05064v1

🔗 Dataset: https://huggingface.co/datasets/daven3/geosignal

ai_machinelearning_big_data

Читать полностью…

Machinelearning

📹 Video-ChatGPT: Towards Detailed Video Understanding via Large Vision and Language Models

It is a multimodal model that merges a video-adapted visual encoder with a LLM.

Video-ChatGPT - это новая модель, способная генерировать осмысленные разговоры о видео.

🖥 Github: https://github.com/mbzuai-oryx/video-chatgpt

⭐️ Demo: https://www.ival-mbzuai.com/video-chatgpt

📕 Paper: https://arxiv.org/abs/2306.05424v1

🔗 Dataset: https://paperswithcode.com/dataset/activitynet-qa

ai_machinelearning_big_data

Читать полностью…

Machinelearning

📹 Video-LLaMA: An Instruction-tuned Audio-Visual Language Model for Video Understanding

LLaMA is working on empowering large language models with video and audio understanding capability.

Video-LLaMA - мультимодальная система, которая расширяет возможности больших языковых моделей (LLM) для понимания как визуального, так и аудио контента в видео.

🖥 Github: https://github.com/damo-nlp-sg/video-llama

📕 Paper: https://arxiv.org/abs/2306.02858

Demo: https://huggingface.co/spaces/DAMO-NLP-SG/Video-LLaMA

📌 Model: https://modelscope.cn/studios/damo/video-llama/summary

ai_machinelearning_big_data

Читать полностью…

Machinelearning

Segment Anything 3D

SAM-3D: A toolbox transfers 2D SAM segments into 3D scene-level point clouds.

Новый фреймворк, который может предсказывать маски объектов в трехмерных сценах, используя модель
"Segment-Anything" (SAM) в RGB изображениях без дополнительного обучения или настройки.

🖥 Github: https://github.com/pointcept/segmentanything3d

Paper: https://arxiv.org/abs/2306.03908v1

📌 Dataset: https://paperswithcode.com/dataset/scannet

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🦍 Gorilla: Large Language Model Connected with Massive APIs

Gorilla a finetuned LLaMA-based model that surpasses the performance of GPT-4 on writing API calls.

Gorilla — это модель, обученная на основе LLaMA, для вызова 1600+ сторонних API. На вход подается запрос на естественном языке, модель находит семантически и синтаксически правильное API для настройки модели мо. Производительность настроенной модели превосходит GPT-4 на трех масштабных наборах данных.

🖥 Github: https://github.com/ShishirPatil/gorilla

📕 Paper: https://arxiv.org/abs/2305.15334

🔗 Demo: https://drive.google.com/file/d/1E0k5mG1mTiaz0kukyK1PdeohJipTFh6j/view?usp=share_link

👉 Project: https://shishirpatil.github.io/gorilla/

⭐️ Colab: https://colab.research.google.com/drive/1DEBPsccVLF_aUnmD0FwPeHFrtdC0QIUP?usp=sharing

ai_machinelearning_big_data

Читать полностью…

Machinelearning

Есть опыт в машинном обучении, но хотите расти дальше?

Валерий Бабушкин, Vice President, Data Science в Blockchainꓸcom, вместе с karpov.courses создали продвинутый курс по ML, на котором вы научитесь решать нестандартные и востребованные бизнесом задачи.

Здесь вы познакомитесь с best practices индустрии и освоите все этапы работы ML-инженера: от сбора и разметки данных до деплоя собственных приложений.

К концу обучения вы создадите пять ML-сервисов, решающих реальные прикладные задачи, и научитесь проектировать всю необходимую для их работы инфраструктуру. 

Будет непросто, но это того стоит! Новый поток стартует уже сегодня, а по промокоду AIBIGDATA27 вы получите скидку 5%.

[Зарегистрироваться]

Читать полностью…

Machinelearning

Wuerstchen: Efficient Pretraining of Text-to-Image Models

Novel technique for text-to-image synthesis that unites competitive performance with unprecedented cost-effectiveness and ease of training on constrained hardwar

Würstchen - это новый фреймворк для обучения моделей преобразования текста в изображения путем перемещения затратного вычислительно этапа текстового преобразования в сильно сжатое латентное пространство


🖥 Github: https://github.com/dome272/wuerstchen

Paper: https://arxiv.org/abs/2306.00637v1

📌 Colab: https://colab.research.google.com/drive/1UTP9Xn2UIrVbAXyL-SKEvyLmgVWdw-Vy

ai_machinelearning_big_data

Читать полностью…

Machinelearning

Hiera: A Hierarchical Vision Transformer without the Bells-and-Whistles

Hiera is a hierarchical vision transformer that is fast, powerful, and, above all, simple. It outperforms the state-of-the-art across a wide array of image and video tasks while being much faster.

Hiera - это быстрый, мощный и, прежде всего, простой метод иерархической перегруппировки информации.

Он превосходит современные методы в широком спектре задач, связанных с изображениями и видео.

pip install hiera-transformer

🖥 Github: https://github.com/stevengrove/gpt4tools

Paper: https://arxiv.org/abs/2306.00989v1

📌 Dataset: https://paperswithcode.com/dataset/inaturalist

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🔥 10 Free Machine Learning Courses from Top Universities

Топ бесплатных курсов машинного обучения от лучших университетов мира

1. Introduction to Machine Learning - UC Berkeley

2. Introduction to Machine Learning - Carnegie Mellon University

3. Machine Learning - Stanford University

4. Machine Learning & Data Mining - Caltech

5. Learning from Data - Caltech

6. Machine Learning for Intelligent Systems - Cornell University

7. Large Scale Machine Learning - University of Toronto

8. user-yd6im1cq5k/about">Machine Learning with Large Datasets - Carnegie Mellon University

9. Foundations of Machine Learning and Statistical Inference - Caltech

10. Algorithmic Aspects of Machine Learning - MIT

ai_machinelearning_big_data

Читать полностью…

Machinelearning

Introducing BERTopic Integration with the Hugging Face Hub

BERTopic provides a powerful tool for users to uncover significant topics within text collections, thereby gaining valuable insights.

BERTopic - это современная библиотека Python, которая упрощает процесс моделирования тем, используя различные трансформеры и c-TF-IDF для создания кластеров на основе плотности, позволяющих легко интерпретировать темы, сохраняя при этом важные слова в описаниях тем.

pip install bertopic

🤗 Hugging face: https://huggingface.co/blog/bertopic

🖥 Github: https://github.com/MaartenGr/BERTopic

Colab: https://colab.research.google.com/#fileId=https://huggingface.co/spaces/davanstrien/blog_notebooks/blob/main/BERTopic_hub_starter.ipynb

📌 Docs: https://maartengr.github.io/BERTopic/getting_started/quickstart/quickstart.html

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🔥 GPT4Tools: Teaching LLM to Use Tools via Self-instruction

GPT4Tools is a centralized system that can control multiple visual foundation models. It is based on Vicuna (LLaMA), and 71K self-built instruction data.

GPT4Tools - это интеллектуальная система, которая может автоматически принимать решения, управлять и использовать различные визуальные модели, позволяя пользователю взаимодействовать с изображениями во время диалога с Chatgpt.

🖥 Github: https://github.com/stevengrove/gpt4tools

Paper: https://arxiv.org/abs/2305.18752v1

📌 Project: https://gpt4tools.github.io/

ai_machinelearning_big_data

Читать полностью…

Machinelearning

🦙 BigTrans 🚀

BigTrans which adapts LLaMA that covers only 20 languages and enhances it with multilingual translation capability on more than 100 languag

Предварительные эксперименты по многоязычному переводу показывают, что BigTrans сравним с ChatGPT и Google Translate на многих языках и даже превосходит ChatGPT в 8 языковых парах.

🖥 Github: https://github.com/ZNLP/BigTrans/tree/main

Paper: https://arxiv.org/abs/2305.18098v1

📌 Dataset: https://paperswithcode.com/dataset/flores-200

ai_machinelearning_big_data

Читать полностью…
Подписаться на канал