353143
Самая актуальная информация из мира ML, Нейронных сетей,DI По всем вопросам- @haarrp @itchannels_telegram - 🔥 best it channels @pythonl - 🐍 @machinee_learning -chat @ArtificialIntelligencedl - AI @datascienceiot - ml 📚 @machinelearning_ru ml
🔄 Caption Anything: Interactive Image Description with Diverse Multimodal Controls
Caption-Anything is a versatile tool combining image segmentation, visual captioning, and ChatGPT, generating tailored captions with diverse controls for user preferences.
Универсальный инструмент для работы с изображениями, сочетающий в себе возможности, Visual Captioning, SAM, ChatGPT. Модель генерирует описательные подписи для любого объекта на изображении.
🖥 Github: https://github.com/ttengwang/caption-anything
⏩ Paper: https://arxiv.org/abs/2305.02677v1
📌 Dataset: https://paperswithcode.com/dataset/cityscapes-3d
🖥 Colab: https://colab.research.google.com/github/ttengwang/Caption-Anything/blob/main/notebooks/tutorial.ipynb
ai_machinelearning_big_data