AI 神奇
首頁
探索最佳AI工具
您尋找適合任何任務的人工智能解決方案的終極目錄。
Search
其他
(4387)
L
unknown
Large Language Model Evaluation in 2024: 5 Methods
在2024年使用五種方法評估大型語言模型。
其他
成對偏好評估
人類判斷對齊
最新的LLM評估技術
H
unknown
How to Evaluate Large Language Model Outputs: Current Best Practices | FinetuneDB
評估大型語言模型輸出的指南與最佳實踐。
其他
全面的LLM評估方法
當前的最佳實踐
專家見解
H
unknown
How to Evaluate LLM Applications: The Complete Guide - Confident AI
有效評估大型語言模型應用的指南。
其他
全面的 LLM 評估方法
指標與最佳實踐
AI 應用評估技術
L
unknown
LLM Evaluation: Everything You Need To Run, Benchmark Evals
LLM 產品評估的全面指南。
其他
執行和基準 LLM 評估
LLM 產品評估的終極指南
LLM 評估所需的一切
I
unknown
ianarawjo/ChainForge
用於測試與大型語言模型互動的視覺工具
其他
視覺化程式設計環境
經過戰鬥測試的提示
大型語言模型整合
E
unknown
Evaluating Large Language Models
使用方法、最佳實踐和工具評估大型語言模型
大型語言模型 (LLM)
大型語言模型評估方法
大型語言模型最佳實踐
大型語言模型評估工具
R
unknown
Reward Bench Leaderboard - a Hugging Face Space by allenai
LiveBench:一個挑戰性的 LLM 基準測試,無污染。
其他
generates product descriptions
uses AI for writing assistance
L
unknown
LLM Benchmarks: MMLU, HellaSwag, BBH, and Beyond - Confident AI
探索 LLM 基準測試如 MMLU、HellaSwag 和 BBH 以進行 AI 評估。
其他
提供 LLM 基準測試數據集
包含 MMLU、HellaSwag 和 BBH 測試
提供 AI 性能評估工具
C
unknown
confident-ai/deepeval
使用全面的框架評估大型語言模型。
其他
自動化大型語言模型評估
指標和基準
輕鬆與大型語言模型整合
M
unknown
Multi-Agent Research Outline
基於大語言模型的多人代理系統研究互動式電子書。
其他
generates structured outlines
customizable templates
integrates with research tools
M
unknown
microsoft/TinyTroupe
由大型語言模型驅動的多智能體模擬,用於創意和商業分析。
其他
多智能體人格模擬
想像力增強
商業洞見
A
unknown
AgentGPT
在您的瀏覽器中直接部署自主 AI 代理。
其他
組裝 AI 代理
設定代理
在瀏覽器中部署代理
A
unknown
AI Agent Basics: Let’s Think Step By Step - by Jon Stokes
使用 Hugging Face 的 Transformers Agent 學習 AI 代理基礎知識。
其他
自然語言 API
基於 Hugging Face 的 transformers 建立而成
逐步學習
F
unknown
Fine-Tuner.ai
輕鬆無需代碼建立 AI 代理程式。
其他
無需代碼的 AI 代理程式建立
友善用戶介面
可自訂的代理程式
C
unknown
ChatArena
為大型語言模型創建多代理環境
其他
建立多代理環境
專為大型語言模型設計
促進複雜的人工智能互動
B
unknown
BrainstormGPT
用於複雜問題解決的 AI 多智能體系統。
其他
content generation
writing assistance
creative writing support
I
unknown
Introducing AACP | SuperAGI
AACP 是一種代理到代理的通訊協議。
其他
代理到代理的通訊
協議設計
AI 協作
G
unknown
GPT Researcher
AI 代理供洞察和研究之用
其他
產生 AI 代理
提供洞察
支援研究
A
unknown
AgentBench: Evaluating LLMs as Agents
用於評估大型語言模型作為代理的基準
其他
evaluates LLMs in agent roles
provides performance metrics
assesses decision-making capabilities
A
unknown
AI Town
一個供 AI 角色聊天和社交的虛擬鎮。
其他
AI 角色居住在虛擬鎮中
角色聊天和社交
創建一個 AI 社交環境
A
open source
a16z-infra/ai-town
可部署的開始套件,用於建立 AI 鎮。
人工智慧模型
可自訂的 AI 角色們
虛擬鎮區環境
MIT 授權
P
unknown
Practices for Governing Agentic AI Systems
為了確保 AI 代理的安全與負責任而實行的實踐。
其他
提供安全代理操作的實踐
專注於代理的負責任
提供治理自主式 AI 的指導原則
T
unknown
TailorTask
自動化無聊的任務,無需編程或使用新工具
其他
自動化重複性任務
無需編程
無需使用新工具
H
open source
Hexabot
開源 AI 聊天機器人建立工具,支援大型語言模型和社交媒體。
其他
建立 AI 聊天機器人/代理
整合大型語言模型
連接社交媒體頻道
Previous
Page 61 of 183
Next