Chatterbox——功能强大的开源AI音频处理人工智能;
— 仅需5秒语音片段即可轻松克隆任意声音;
— 支持多种参数设置生成配音;
— 拥有专属语音库;
— 高质量文本转语音;
— 提供API接口实现跨平台集成;
— 支持多语种,含中文;
— 完全免费。
🧬 https://www.resemble.ai/chatterbox/
#tools #AI #video
— 仅需5秒语音片段即可轻松克隆任意声音;
— 支持多种参数设置生成配音;
— 拥有专属语音库;
— 高质量文本转语音;
— 提供API接口实现跨平台集成;
— 支持多语种,含中文;
— 完全免费。
🧬 https://www.resemble.ai/chatterbox/
#tools #AI #video
www.resemble.ai
Chatterbox: Open Source Text-to-Speech | Resemble AI
Chatterbox is Resemble AI's free, open-source TTS model, MIT-licensed with emotion control, real-time generation, and zero-shot voice cloning from 5 seconds of audio.
Hugging Face AI Sheets 是一款开源工具,允许用户通过人工智能模型创建和转换数据集,无需编程技能。
该工具支持本地部署和Hugging Face Hub平台部署,通过推理提供程序提供多种模型访问。
🧬 https://github.com/huggingface/aisheets
#AI #tools #Security
该工具支持本地部署和Hugging Face Hub平台部署,通过推理提供程序提供多种模型访问。
🧬 https://github.com/huggingface/aisheets
#AI #tools #Security
GitHub
GitHub - huggingface/aisheets: Build, enrich, and transform datasets using AI models with no code
Build, enrich, and transform datasets using AI models with no code - huggingface/aisheets
Visual Story-Writing 是一套创新系统,能够自动将文本故事可视化呈现,展示事件的时间线、角色及其行为。
用户可通过便捷的工具编辑故事。
核心功能包括:通过时间轴交互查看事件、在合并或移动角色时编辑文本,以及重新排列事件顺序。
该系统采用GPT-4o进行信息提取与修改建议。
该程序采用TypeScript开发,结合React和Vite框架,确保与现代浏览器兼容。
🧬 https://github.com/m-damien/VisualStoryWriting
#AI #tools
用户可通过便捷的工具编辑故事。
核心功能包括:通过时间轴交互查看事件、在合并或移动角色时编辑文本,以及重新排列事件顺序。
该系统采用GPT-4o进行信息提取与修改建议。
该程序采用TypeScript开发,结合React和Vite框架,确保与现代浏览器兼容。
🧬 https://github.com/m-damien/VisualStoryWriting
#AI #tools
GitHub
GitHub - m-damien/VisualStoryWriting: 🧙♂️ Writing by manipulating visual representations of stories
🧙♂️ Writing by manipulating visual representations of stories - m-damien/VisualStoryWriting
Videomass 是一款功能丰富的 FFmpeg 图形界面前端,专为各种技能水平的用户设计。
该程序提供丰富的功能,包括转换各种视频和音频格式、连接、修剪、创建缩略图以及音频标准化。
Videomass 是一款免费软件,兼容 Linux、macOS、Windows 和 FreeBSD。
🧬 https://github.com/jeanslack/Videomass
#tools #AI
该程序提供丰富的功能,包括转换各种视频和音频格式、连接、修剪、创建缩略图以及音频标准化。
Videomass 是一款免费软件,兼容 Linux、macOS、Windows 和 FreeBSD。
🧬 https://github.com/jeanslack/Videomass
#tools #AI
GitHub
GitHub - jeanslack/Videomass: Videomass is a free, open source and cross-platform GUI for FFmpeg
Videomass is a free, open source and cross-platform GUI for FFmpeg - jeanslack/Videomass
Translator 是一款 Android 应用,使用本地模型提供文本和图像的离线翻译。
它自动检测语言并支持音译,内置词典。
用户可以下载语言包,无需联网即可持续使用,所有操作均在设备上完成。
🧬 https://github.com/DavidVentura/firefox-translator
#AI #tools
它自动检测语言并支持音译,内置词典。
用户可以下载语言包,无需联网即可持续使用,所有操作均在设备上完成。
🧬 https://github.com/DavidVentura/firefox-translator
#AI #tools
GitHub
GitHub - DavidVentura/offline-translator: Use Firefox Translation Models for on-device translation on Android
Use Firefox Translation Models for on-device translation on Android - DavidVentura/offline-translator
YouTube to Blog Converter 是一款将 YouTube 视频自动转换为专业设计的博客文章的应用,为内容创作者和开发者服务。
用户输入视频 URL,该应用通过 YouTube API 提取元数据,并使用人工智能进行处理,并将数据存储在数据库中。
开发者可以配置AI提示来改变输出风格。
🧬 https://github.com/TheOrcDev/youtube-to-blog
#AI #tools #video
用户输入视频 URL,该应用通过 YouTube API 提取元数据,并使用人工智能进行处理,并将数据存储在数据库中。
开发者可以配置AI提示来改变输出风格。
🧬 https://github.com/TheOrcDev/youtube-to-blog
#AI #tools #video
GitHub
GitHub - TheOrcDev/youtube-to-blog: Simple YouTube url to MDX blog app
Simple YouTube url to MDX blog app. Contribute to TheOrcDev/youtube-to-blog development by creating an account on GitHub.
识别PS的照片和AI生成技术的解决方案2025 ——
1. Forensically — 综合性照片修改检测工具;
https://29a.ch/photo-forensics/#forensic-magnifier
2. Foto Forsenics — 照片分析网站,可识别照片是否经过任何编辑软件的修改;
https://fotoforensics.com/
3. Arti AI/Scam Detector — 浏览器扩展程序,当页面或域名被社区标记为可能包含 AI 生成的内容或诈骗操作时,该扩展程序会自动提醒您。它承诺不会索引或收集访问过的页面的原始内容;
https://chromewebstore.google.com/detail/arti-aiscam-detector/afmbnifdllhokjmbfnoopodfddmcdeda
4. Imageforensic — 另一款用于检测图像修改痕迹的取证工具;
https://www.imageforensic.org/
5. sightengine — 简易在线工具,可检测照片是否由AI生成;
https://sightengine.com/detect-ai-generated-images
6. decopy — 检测图像是否由Midjourney、Stable Diffusion、DALL·E及Flux模型生成。
https://decopy.ai/ai-image-detector/
#AI #tools (在本站内跟随标签以找到更多同类内容)
1. Forensically — 综合性照片修改检测工具;
https://29a.ch/photo-forensics/#forensic-magnifier
2. Foto Forsenics — 照片分析网站,可识别照片是否经过任何编辑软件的修改;
https://fotoforensics.com/
3. Arti AI/Scam Detector — 浏览器扩展程序,当页面或域名被社区标记为可能包含 AI 生成的内容或诈骗操作时,该扩展程序会自动提醒您。它承诺不会索引或收集访问过的页面的原始内容;
https://chromewebstore.google.com/detail/arti-aiscam-detector/afmbnifdllhokjmbfnoopodfddmcdeda
4. Imageforensic — 另一款用于检测图像修改痕迹的取证工具;
https://www.imageforensic.org/
5. sightengine — 简易在线工具,可检测照片是否由AI生成;
https://sightengine.com/detect-ai-generated-images
6. decopy — 检测图像是否由Midjourney、Stable Diffusion、DALL·E及Flux模型生成。
https://decopy.ai/ai-image-detector/
#AI #tools (在本站内跟随标签以找到更多同类内容)
29a.ch
Forensically, free online photo forensics tools
Forensically is a set of free tools for digital image forensics. It includes clone detection, error level analysis, meta data extraction and more.
Eclaire 是一款预发布版的本地部署 AI 系统,专注于任务组织、搜索和自动化。
主要功能包括:自托管、集中处理多种数据类型、跨平台支持以及通过开放 API 进行集成。
该应用支持多种 AI 模型,用户可以根据自身需求进行定制。
🧬 https://github.com/eclaire-labs/eclaire/
#AI #tools
主要功能包括:自托管、集中处理多种数据类型、跨平台支持以及通过开放 API 进行集成。
该应用支持多种 AI 模型,用户可以根据自身需求进行定制。
🧬 https://github.com/eclaire-labs/eclaire/
#AI #tools
GitHub
GitHub - eclaire-labs/eclaire: Local-first, open-source AI assistant for your data. Unify tasks, notes, docs, photos, and bookmarks.…
Local-first, open-source AI assistant for your data. Unify tasks, notes, docs, photos, and bookmarks. Private, self-hosted, and extensible via APIs. - eclaire-labs/eclaire
Edit Mind 是一款跨平台的 AI 驱动型离线视频搜索应用。
目前仍处于早期开发阶段,它提供全音频转录、人脸识别、按描述搜索场景和视频以及屏幕文本分析等功能。
添加视频后,应用会进行全面分析,将其分解为多个场景并创建索引数据库,使用户能够对视频内容进行语义搜索。
🧬 https://github.com/IliasHad/edit-mind/
#tools #AI #video
目前仍处于早期开发阶段,它提供全音频转录、人脸识别、按描述搜索场景和视频以及屏幕文本分析等功能。
添加视频后,应用会进行全面分析,将其分解为多个场景并创建索引数据库,使用户能够对视频内容进行语义搜索。
🧬 https://github.com/IliasHad/edit-mind/
#tools #AI #video
GitHub
GitHub - IliasHad/edit-mind: Local-first Video Knowledge Base. Index your video library with multi-modal analysis (YOLO, DeepFace…
Local-first Video Knowledge Base. Index your video library with multi-modal analysis (YOLO, DeepFace, Whisper), search semantically via natural language, Docker-ready. - IliasHad/edit-mind
使用AI绕过付费墙 ——
Bypass Paywalls Clean 扩展程序及其数千分支版本被从 GitHub 上移除。
以下是一些的可能解决方案。
1. https://www.smry.ai/ — 绕过付费墙并提供每篇文章的摘要;
2. https://www.removepaywall.com/ — 另一个类似的服务;
3. https://byebyepaywall.com/en/ — 所有热门绕避付费墙服务和缓存版的聚合网站。
4. 人工智能浏览器 Atlas 和 Comet 也非常擅长绕过付费墙。
#AI #tools
Bypass Paywalls Clean 扩展程序及其数千分支版本被从 GitHub 上移除。
以下是一些的可能解决方案。
1. https://www.smry.ai/ — 绕过付费墙并提供每篇文章的摘要;
2. https://www.removepaywall.com/ — 另一个类似的服务;
3. https://byebyepaywall.com/en/ — 所有热门绕避付费墙服务和缓存版的聚合网站。
4. 人工智能浏览器 Atlas 和 Comet 也非常擅长绕过付费墙。
#AI #tools
smry.ai
SMRY — Read Any Article Free. AI Summaries, Audio & Chat.
Still hitting paywalls? 350K+ people use SMRY instead. Paste any link — full article in seconds. No signup, optional Chrome extension, free.
Maivi 是一款跨平台应用,利用现代人工智能技术快速将语音转换为文本,并将文本添加到剪贴板。
它提供录音控制快捷键和实时文本显示功能。
适用于 Linux、macOS 和 Windows 系统。
🧬 https://github.com/MaximeRivest/maivi/
#tools #AI
它提供录音控制快捷键和实时文本显示功能。
适用于 Linux、macOS 和 Windows 系统。
🧬 https://github.com/MaximeRivest/maivi/
#tools #AI
GitHub
GitHub - MaximeRivest/maivi: Maivi - My AI Voice Input: Real-time voice-to-text local on cpu better than whisper with hotkey support
Maivi - My AI Voice Input: Real-time voice-to-text local on cpu better than whisper with hotkey support - MaximeRivest/maivi
Antigravity Tools 是一个多账号管理与切换工具。为 Antigravity 提供一键无缝账号切换功能。
还可以将 Session (Google/Anthropic) 转化为标准化的 API 接口,彻底消除不同厂商间的协议鸿沟。
https://github.com/lbjlaq/Antigravity-Manager
#AI #tools
还可以将 Session (Google/Anthropic) 转化为标准化的 API 接口,彻底消除不同厂商间的协议鸿沟。
https://github.com/lbjlaq/Antigravity-Manager
#AI #tools
GitHub
GitHub - lbjlaq/Antigravity-Manager: Professional Antigravity Account Manager & Switcher. One-click seamless account switching…
Professional Antigravity Account Manager & Switcher. One-click seamless account switching for Antigravity Tools. Built with Tauri v2 + React (Rust).专业的 Antigravity 账号管理与切换工具。为 Antigravity 提...
Android-MCP是一款开源MCP服务器,用于将AI代理与Android设备集成,支持在不依赖传统方法的情况下执行实际任务。
该平台使LLM代理能够通过访问Android API和命令,实现应用导航、界面交互及自动化测试功能。
核心特性包括:通过ADB与Android集成、无需额外配置即可支持任意LLM,以及支持手势操作和截屏等移动自动化工具。
🧬 https://github.com/CursorTouch/Android-MCP/
#AI #tools
该平台使LLM代理能够通过访问Android API和命令,实现应用导航、界面交互及自动化测试功能。
核心特性包括:通过ADB与Android集成、无需额外配置即可支持任意LLM,以及支持手势操作和截屏等移动自动化工具。
🧬 https://github.com/CursorTouch/Android-MCP/
#AI #tools
GitHub
GitHub - CursorTouch/Android-MCP: MCP Server for interacting with Android Devices.
MCP Server for interacting with Android Devices. Contribute to CursorTouch/Android-MCP development by creating an account on GitHub.
Paper2Slides 是一款人工智能工具,可快速将科学论文和报告转换为专业的幻灯片和海报。
其主要功能包括支持多种格式、使用 RAG 技术提取内容、保留源文件、自定义样式以及快速创建并即时预览素材。
它还具备会话管理功能,可通过检查点保存进度。
该工具通过并行生成幻灯片来提高处理速度。
🧬 https://github.com/HKUDS/Paper2Slides
#tools #AI
其主要功能包括支持多种格式、使用 RAG 技术提取内容、保留源文件、自定义样式以及快速创建并即时预览素材。
它还具备会话管理功能,可通过检查点保存进度。
该工具通过并行生成幻灯片来提高处理速度。
🧬 https://github.com/HKUDS/Paper2Slides
#tools #AI
GitHub
GitHub - HKUDS/Paper2Slides: "Paper2Slides: From Paper to Presentation in One Click"
"Paper2Slides: From Paper to Presentation in One Click" - HKUDS/Paper2Slides
Prism 是一款基于人工智能的跨平台机器翻译软件。
该程序支持多种操作系统,包括 Windows、macOS 和 Linux。
直观的界面,方便各类用户使用。
语言:Vue
🧬 https://github.com/qyzhg/prism
#tools #AI
该程序支持多种操作系统,包括 Windows、macOS 和 Linux。
直观的界面,方便各类用户使用。
语言:Vue
🧬 https://github.com/qyzhg/prism
#tools #AI
GitHub
GitHub - qyzhg/prism: 全平台AI翻译软件
全平台AI翻译软件. Contribute to qyzhg/prism development by creating an account on GitHub.
llm-god - 是一个桌面 AI 应用,允许您同时向多个LLM 接口(如 ChatGPT、Gemini 等等)提交查询。
该应用程序允许您保存和编辑常用查询以便快速访问,拥有简洁的用户界面易于操作。
它使用 Electron 和 JavaScript 开发,确保跨平台支持和灵活的开发方式。
语言:TypeScript
🧬 https://github.com/czhou578/llm-god
#tools #AI
该应用程序允许您保存和编辑常用查询以便快速访问,拥有简洁的用户界面易于操作。
它使用 Electron 和 JavaScript 开发,确保跨平台支持和灵活的开发方式。
语言:TypeScript
🧬 https://github.com/czhou578/llm-god
#tools #AI
GitHub
GitHub - czhou578/llm-god: Desktop app to multi-prompt ChatGPT, Gemini and more at the same time!
Desktop app to multi-prompt ChatGPT, Gemini and more at the same time! - czhou578/llm-god
Koodo Reader - 是一款集电子书管理和阅读功能于一体的现代化软件,支持同步和备份,适用于 Windows、macOS、Linux、Android、iOS 及网页平台。
该程序支持 15 种以上的流行电子书格式,包括 EPUB、PDF、MOBI、 AZW3、TXT以及漫画,为您提供灵活多样的阅读来源选择。
核心功能包括:通过 OneDrive、Google Drive、Dropbox 等云服务同步书库、阅读进度、书签、书架、标注和笔记。
Koodo Reader 提供 AI 智能翻译工具、海量词典和内容丰富的注释,以及可自定义的界面,支持更改字体、主题和显示模式。
有中文版。
语言:JavaScript
🧬 https://github.com/koodo-reader/koodo-reader
#tools #books #AI
该程序支持 15 种以上的流行电子书格式,包括 EPUB、PDF、MOBI、 AZW3、TXT以及漫画,为您提供灵活多样的阅读来源选择。
核心功能包括:通过 OneDrive、Google Drive、Dropbox 等云服务同步书库、阅读进度、书签、书架、标注和笔记。
Koodo Reader 提供 AI 智能翻译工具、海量词典和内容丰富的注释,以及可自定义的界面,支持更改字体、主题和显示模式。
有中文版。
语言:JavaScript
🧬 https://github.com/koodo-reader/koodo-reader
#tools #books #AI
GitHub
GitHub - koodo-reader/koodo-reader: A modern ebook manager and reader with sync and backup capacities for Windows, macOS, Linux…
A modern ebook manager and reader with sync and backup capacities for Windows, macOS, Linux, Android, iOS and Web - koodo-reader/koodo-reader
robin - 是一个利用AI在暗网进行开源情报研究的工具。
它使用大型语言模型进行查询、过滤搜索结果、并提供调查摘要。
可自动访问多个暗网搜索引擎和洋葱网站索引,收集并解析找到的暗网页面,忽略掉失效的链接和噪音,并将收集到的内容通过LLM进行处理,以清理、构建和总结结果,满足分析人员的需求。
该程序支持多种AI模型,并采用模块化架构以提高灵活性。
语言:Python
🧬 https://github.com/apurvsinghgautam/robin
#tools #AI #osint #Security
它使用大型语言模型进行查询、过滤搜索结果、并提供调查摘要。
可自动访问多个暗网搜索引擎和洋葱网站索引,收集并解析找到的暗网页面,忽略掉失效的链接和噪音,并将收集到的内容通过LLM进行处理,以清理、构建和总结结果,满足分析人员的需求。
该程序支持多种AI模型,并采用模块化架构以提高灵活性。
语言:Python
🧬 https://github.com/apurvsinghgautam/robin
#tools #AI #osint #Security
GitHub
GitHub - apurvsinghgautam/robin: AI-Powered Dark Web OSINT Tool
AI-Powered Dark Web OSINT Tool. Contribute to apurvsinghgautam/robin development by creating an account on GitHub.
HexStrike AI MCP Agents 是一款高级 MCP 服务器,它支持 AI 代理(例如 Claude、GPT、Copilot 等)自主运行150多种网络安全工具,用于自动化渗透测试、漏洞检测、自动化漏洞赏金计划和安全研究。
主要功能包括支持 12 种以上的 AI 代理进行自主决策和工作流管理,以及通过 Nuclei 集成 4000 多个漏洞模板,涵盖 35 种以上的攻击类别,从 Web 应用程序到云基础设施。
还包括漏洞赏金和开源情报工具库(20多种)、CTF 和取证工具(20多款)……
语言:Python
🧬 https://github.com/0x4m4/hexstrike-ai
#tools #AI #osint
主要功能包括支持 12 种以上的 AI 代理进行自主决策和工作流管理,以及通过 Nuclei 集成 4000 多个漏洞模板,涵盖 35 种以上的攻击类别,从 Web 应用程序到云基础设施。
还包括漏洞赏金和开源情报工具库(20多种)、CTF 和取证工具(20多款)……
语言:Python
🧬 https://github.com/0x4m4/hexstrike-ai
#tools #AI #osint
GitHub
GitHub - 0x4m4/hexstrike-ai: HexStrike AI MCP Agents is an advanced MCP server that lets AI agents (Claude, GPT, Copilot, etc.)…
HexStrike AI MCP Agents is an advanced MCP server that lets AI agents (Claude, GPT, Copilot, etc.) autonomously run 150+ cybersecurity tools for automated pentesting, vulnerability discovery, bug b...
Linly-Dubbing - 是一个开源工具,利用人工智能技术自动将视频翻译成多种语言。
它支持自动视频上传、人声分离、语音识别、基于大型语言模型的翻译以及语音合成。
它集成了多种技术,例如用于视频上传的 yt-dlp、用于人声分离的 Demucs 和 UVR5、用于语音识别的 WhisperX 和 FunASR,以及用于翻译的 OpenAI API 和 Qwen。
语音合成采用 Edge TTS、XTTS、CosyVoice 和 GPT-SoVITS,提供高质量的配音。
它还支持与数字虚拟形象进行唇形同步,增强翻译内容的真实感。
语言:Jupyter Notebook
🧬 https://github.com/Kedreamix/Linly-Dubbing
#tools #AI
它支持自动视频上传、人声分离、语音识别、基于大型语言模型的翻译以及语音合成。
它集成了多种技术,例如用于视频上传的 yt-dlp、用于人声分离的 Demucs 和 UVR5、用于语音识别的 WhisperX 和 FunASR,以及用于翻译的 OpenAI API 和 Qwen。
语音合成采用 Edge TTS、XTTS、CosyVoice 和 GPT-SoVITS,提供高质量的配音。
它还支持与数字虚拟形象进行唇形同步,增强翻译内容的真实感。
语言:Jupyter Notebook
🧬 https://github.com/Kedreamix/Linly-Dubbing
#tools #AI
GitHub
GitHub - Kedreamix/Linly-Dubbing: 智能视频多语言AI配音/翻译工具 - Linly-Dubbing — “AI赋能,语言无界”
智能视频多语言AI配音/翻译工具 - Linly-Dubbing — “AI赋能,语言无界”. Contribute to Kedreamix/Linly-Dubbing development by creating an account on GitHub.