How-To Guide | Galileo Evaluate

Log Pre-generated Responses in Python

Experiment with Multiple Chain Workflows

Logging and Comparing Against Your Expected Answers

Evaluate and Optimize RAG Applications

Evaluate and Optimize Agents, Chains or Multi-step Workflows

Evaluate and Optimize Prompts

Experiment with Multiple Prompts

Choose your Guardrail Metrics

Enabling Scorers in Runs

Register Custom Metrics

Customize Chainpoll-powered Metrics

Understand Your Metric's Values

A/B Compare Prompts

Evaluate with Human Feedback

Identify Hallucinations

Rank your Runs

Share a Project

Collaborate with Other Personas

Export Your Evaluation Runs

Add Tags and Metadata to Prompt Runs

Programmatically Fetch Logged Data

Set up Access Controls

Prompt Management & Storage

Create an Evaluation Set

⌘I

How-To Guide | Galileo Evaluate

Log Pre-generated Responses in Python

Experiment with Multiple Chain Workflows

Logging and Comparing Against Your Expected Answers

Evaluate and Optimize RAG Applications

Evaluate and Optimize Agents, Chains or Multi-step Workflows

Evaluate and Optimize Prompts

Experiment with Multiple Prompts

Choose your Guardrail Metrics

Enabling Scorers in Runs

Register Custom Metrics

Customize Chainpoll-powered Metrics

Understand Your Metric's Values

A/B Compare Prompts

Evaluate with Human Feedback

Identify Hallucinations

Rank your Runs

Share a Project

Collaborate with Other Personas

Export Your Evaluation Runs

Add Tags and Metadata to Prompt Runs

Programmatically Fetch Logged Data

Set up Access Controls

Prompt Management & Storage

Create an Evaluation Set

Log Pre-generated Responses in Python

Experiment with Multiple Chain Workflows

Logging and Comparing Against Your Expected Answers

Evaluate and Optimize RAG Applications

Evaluate and Optimize Agents, Chains or Multi-step Workflows

Evaluate and Optimize Prompts

Experiment with Multiple Prompts

Choose your Guardrail Metrics

Enabling Scorers in Runs

Register Custom Metrics

Customize Chainpoll-powered Metrics

Understand Your Metric's Values

A/B Compare Prompts

Evaluate with Human Feedback

Identify Hallucinations

Rank your Runs

Share a Project

Collaborate with Other Personas

Export Your Evaluation Runs

Add Tags and Metadata to Prompt Runs

Programmatically Fetch Logged Data

Set up Access Controls

Prompt Management & Storage

Create an Evaluation Set