免費(fèi)AI 助手,提供聊天、文檔閱讀、音視頻速讀、AI 創(chuàng)作(圖像/視頻/音頻)等。阿里云自主研發(fā)的大語言模型
AI Ping是面向大模型使用者,提供全面、客觀、真實(shí)的大模型服務(wù)評測與信息匯總平臺。提供長周期、高頻率、多時(shí)段評測數(shù)據(jù),助力您高效完成大模型服務(wù)的選型與供應(yīng)商評估
開源大模型平臺
科大訊飛推出的新一代認(rèn)知智能大模型
知識庫大模型,智能客服,智能問答,AI寫作
一個(gè)專注于大語言模型API 價(jià)格對比的權(quán)威在線工具,旨在幫助開發(fā)者、企業(yè)用戶和研究人員快速、直觀地比較主流AI模型的服務(wù)成本。
由中國科學(xué)院深圳先進(jìn)技術(shù)研究院、香港中文大學(xué)、INSAIT 等機(jī)構(gòu)聯(lián)合提出的一種基于擴(kuò)散模型先驗(yàn)的圖像復(fù)原方法
新一代面向軟件工程、競賽編程的代碼大模型系列,該模型聚焦于代碼智能領(lǐng)域,具備能讀懂、能寫、能改代碼的綜合能力,可用于自動(dòng)編程、Bug修復(fù)和代碼解釋等多類任務(wù)
Z-Image(造相)是通義實(shí)驗(yàn)室推出的一款高效圖像生成基礎(chǔ)模型,基于單流擴(kuò)散Transformer架構(gòu)(Scalable Single-Stream DiT, S3-DiT),參數(shù)量達(dá)60億。
Grsai聚合了各種優(yōu)秀的主流圖片與視頻生成大模型,以低于官網(wǎng)好幾倍的價(jià)格為您降低使用成本!提供企業(yè)級專業(yè)穩(wěn)定的API中轉(zhuǎn)站,服務(wù)穩(wěn)定可靠,達(dá)到99.99%。
一個(gè)與人工智能(AI)模型評估和比較相關(guān)的平臺,其核心功能是通過用戶投票和社區(qū)參與的方式,對大型語言模型(LLM)進(jìn)行評測和排名。
MonkeyOCR是一款開源文檔解析模型,專注于高效、精準(zhǔn)地解析復(fù)雜結(jié)構(gòu)化文檔。
IndexTTS2 是一個(gè)突破性的自回歸語音合成模型,旨在解決大規(guī)模文本到語音(TTS)系統(tǒng)在精確時(shí)長控制和情感表達(dá)方面的挑戰(zhàn)。
專注于語言模型(LLM)SQL 能力評測的專業(yè)平臺,構(gòu)建了全面且具實(shí)踐價(jià)值的 SQL 能力排行榜(SCALE),為開發(fā)者、數(shù)據(jù)庫管理員及企業(yè)技術(shù)決策者提供關(guān)鍵參考
美團(tuán)自主研發(fā)的生成式AI大模型,模型具備強(qiáng)大的多模態(tài)能力,能處理文本、圖像等多種數(shù)據(jù)類型
Kimi K2 是北京月之暗面科技有限公司于 2025 年 7 月 11 日推出的開源大語言模型。
MMAudio是一個(gè)多模態(tài)音頻生成模型,旨在通過視頻和/或文本輸入生成高質(zhì)量、同步的音頻。
Veo 3 是 Google DeepMind 推出的新一代視頻生成模型,專為電影制作人、故事講述者和創(chuàng)意工作者設(shè)計(jì),將視頻與音頻無縫結(jié)合,開啟生成式 AI 的創(chuàng)作新篇章。
字節(jié)跳動(dòng)開發(fā)的AI視頻生成模型,模型能夠根據(jù)文本或圖像生成高質(zhì)量的視頻內(nèi)容,支持多鏡頭切換、穩(wěn)定運(yùn)動(dòng)軌跡和風(fēng)格化控制,適用于創(chuàng)意內(nèi)容創(chuàng)作、廣告制作和教育演示等場景。
Hallo 是一個(gè)由復(fù)旦大學(xué)(Fudan University)開發(fā)的開源項(xiàng)目,專注于音頻驅(qū)動(dòng)的視覺合成技術(shù),特別是用于人像動(dòng)畫生成。
MuseTalk 是一個(gè)實(shí)時(shí)高質(zhì)量音頻驅(qū)動(dòng)唇形同步模型,旨在解決高分辨率、身份一致性和準(zhǔn)確唇形同步的面部視覺配音挑戰(zhàn),尤其適用于實(shí)時(shí)應(yīng)用如直播視頻 。
SadTalker 是一個(gè)基于單張圖像和音頻生成說話人臉視頻的模型,其核心功能是通過音頻輸入使靜態(tài)圖片中的圖像動(dòng)起來,并生成說話的虛擬人物。
一款高性能文本到語音(TTS)系統(tǒng),基于流匹配的非自回歸生成方法,結(jié)合了擴(kuò)散變換器(DiT)技術(shù)。
Seed-TTS 是由字節(jié)跳動(dòng)開發(fā)的高級文本到語音(TTS)模型系列,旨在生成高質(zhì)量、幾乎無法與人類語音區(qū)分的語音。
MiniMind項(xiàng)目旨在從零開始訓(xùn)練一個(gè)輕量級語言模型(LLM),并提供完整的訓(xùn)練、微調(diào)、推理和部署流程。
Qwen-Image 是阿里通義千問團(tuán)隊(duì)于2025年8月5日開源的200億參數(shù)圖像生成基礎(chǔ)模型,采用MMDiT架構(gòu),專為復(fù)雜文本渲染與高精度圖像生成設(shè)計(jì)。
gpt-oss 是 OpenAI 開發(fā)的開源模型,支持推理、代理任務(wù)和開發(fā)者使用場景。
Moondream 是一個(gè)開源的輕量級視覺語言模型,由開發(fā)者 vikhyatk 推出,旨在提供高效、靈活的圖像理解和文本生成能力。
“林哥的大模型野榜”是一個(gè)專注于中國用戶需求的大模型產(chǎn)品排行榜,旨在幫助用戶更好地了解和選擇適合的大模型產(chǎn)品。
元象大模型XChat是一款由元象科技自主研發(fā)的高性能通用人工智能大模型,旨在降低開發(fā)門檻與推理成本,滿足多任務(wù)需求。
訊飛星辰MaaS平臺是科大訊飛推出的一款一站式大模型定制精調(diào)平臺,旨在為開發(fā)者和企業(yè)用戶提供低門檻、全棧式的大模型應(yīng)用開發(fā)服務(wù)。
達(dá)醫(yī)智影是阿里巴巴達(dá)摩院醫(yī)療AI實(shí)驗(yàn)室研發(fā)的一款創(chuàng)新性AI醫(yī)療工具,專注于CT智能讀片和癌癥篩查領(lǐng)域。
友鏈申請免責(zé)聲明廣告合作關(guān)于本站