Setup Providers

Configure LLM providers for OpenAI, Claude, and Gemini.

Goal

Connect to LLM providers with proper configuration and authentication.

OpenAI Setup

Basic Setup

import "github.com/AltairaLabs/PromptKit/runtime/providers/openai"

provider := openai.NewOpenAIProvider(
    "openai",
    "gpt-4o-mini",
    "",  // Default URL
    openai.DefaultProviderDefaults(),
    false,
)
defer provider.Close()

Environment Variables

export OPENAI_API_KEY="sk-..."

Custom Configuration

customDefaults := providers.ProviderDefaults{
    Temperature: 0.8,
    TopP:        0.95,
    MaxTokens:   2000,
    Pricing: providers.Pricing{
        InputCostPer1K:  0.00015,
        OutputCostPer1K: 0.0006,
    },
}

provider := openai.NewOpenAIProvider(
    "openai",
    "gpt-4o-mini",
    "",
    customDefaults,
    false,
)

Available Models

// Fast and cheap
provider := openai.NewOpenAIProvider("openai", "gpt-4o-mini", "", defaults, false)

// Balanced
provider := openai.NewOpenAIProvider("openai", "gpt-4o", "", defaults, false)

// Advanced reasoning
provider := openai.NewOpenAIProvider("openai", "gpt-4-turbo", "", defaults, false)

Claude Setup

Basic Setup

import "github.com/AltairaLabs/PromptKit/runtime/providers/claude"

provider := claude.NewClaudeProvider(
    "claude",
    "claude-3-5-sonnet-20241022",
    "",
    claude.DefaultProviderDefaults(),
    false,
)
defer provider.Close()

Environment Variables

export ANTHROPIC_API_KEY="sk-ant-..."

Available Models

// Fast and cheap
provider := claude.NewClaudeProvider("claude", "claude-3-haiku-20240307", "", defaults, false)

// Balanced (recommended)
provider := claude.NewClaudeProvider("claude", "claude-3-5-sonnet-20241022", "", defaults, false)

// Most capable
provider := claude.NewClaudeProvider("claude", "claude-3-opus-20240229", "", defaults, false)

Gemini Setup

Basic Setup

import "github.com/AltairaLabs/PromptKit/runtime/providers/gemini"

provider := gemini.NewGeminiProvider(
    "gemini",
    "gemini-1.5-flash",
    "",
    gemini.DefaultProviderDefaults(),
    false,
)
defer provider.Close()

Environment Variables

export GEMINI_API_KEY="..."

Available Models

// Fast and cheap
provider := gemini.NewGeminiProvider("gemini", "gemini-1.5-flash", "", defaults, false)

// Advanced (large context)
provider := gemini.NewGeminiProvider("gemini", "gemini-1.5-pro", "", defaults, false)

Multi-Provider Setup

Provider Registry

type ProviderRegistry struct {
    providers map[string]providers.Provider
}

func NewProviderRegistry() *ProviderRegistry {
    return &ProviderRegistry{
        providers: make(map[string]providers.Provider),
    }
}

func (r *ProviderRegistry) Register(name string, provider providers.Provider) {
    r.providers[name] = provider
}

func (r *ProviderRegistry) Get(name string) providers.Provider {
    return r.providers[name]
}

// Setup
registry := NewProviderRegistry()
registry.Register("openai", openaiProvider)
registry.Register("claude", claudeProvider)
registry.Register("gemini", geminiProvider)

// Use
provider := registry.Get("openai")

Fallback Strategy

func ExecuteWithFallback(providers []providers.Provider, req providers.PredictionRequest) (providers.PredictionResponse, error) {
    var lastErr error

    for _, provider := range providers {
        response, err := provider.Predict(ctx, req)
        if err == nil {
            return response, nil
        }
        lastErr = err
        log.Printf("Provider %s failed: %v, trying next...", provider.ID(), err)
    }

    return providers.PredictionResponse{}, fmt.Errorf("all providers failed: %w", lastErr)
}

// Usage
providers := []providers.Provider{openaiProvider, claudeProvider, geminiProvider}
response, err := ExecuteWithFallback(providers, req)

Cost Optimization

Model Selection by Task

func SelectProvider(taskType string) providers.Provider {
    switch taskType {
    case "simple":
        // Use cheapest model
        return openai.NewOpenAIProvider("openai", "gpt-4o-mini", "", defaults, false)
    case "complex":
        // Use more capable model
        return claude.NewClaudeProvider("claude", "claude-3-5-sonnet-20241022", "", defaults, false)
    case "long-context":
        // Use model with large context
        return gemini.NewGeminiProvider("gemini", "gemini-1.5-pro", "", defaults, false)
    default:
        return openai.NewOpenAIProvider("openai", "gpt-4o-mini", "", defaults, false)
    }
}

Token Limits

config := &middleware.ProviderMiddlewareConfig{
    MaxTokens:   500,  // Limit output tokens
    Temperature: 0.7,
}

Testing with Mock Provider

import "github.com/AltairaLabs/PromptKit/runtime/providers/mock"

// Create mock provider
provider := mock.NewMockProvider("mock", "test-model", false)

// Configure responses
provider.AddResponse("Hello", "Hi there!")
provider.AddResponse("What is 2+2?", "4")

// Use in tests
result, err := provider.Predict(ctx, req)

Custom Base URLs

Azure OpenAI

provider := openai.NewOpenAIProvider(
    "azure-openai",
    "gpt-4",
    "https://your-resource.openai.azure.com/openai/deployments/your-deployment",
    defaults,
    false,
)

OpenAI-Compatible Endpoints

provider := openai.NewOpenAIProvider(
    "local-llm",
    "model-name",
    "http://localhost:8080/v1",
    defaults,
    false,
)

Troubleshooting

Authentication Errors

Problem: API key not found.

Solution:

apiKey := os.Getenv("OPENAI_API_KEY")
if apiKey == "" {
    log.Fatal("OPENAI_API_KEY environment variable not set")
}

Rate Limiting

Problem: 429 Too Many Requests.

Solution: Add retry logic:

var response providers.PredictionResponse
var err error

for i := 0; i < 3; i++ {
    response, err = provider.Predict(ctx, req)
    if err == nil {
        break
    }
    if strings.Contains(err.Error(), "rate_limit") {
        time.Sleep(time.Duration(i+1) * time.Second)
        continue
    }
    break
}

Timeout Errors

Problem: Requests timing out.

Solution: Increase context timeout:

ctx, cancel := context.WithTimeout(context.Background(), 60*time.Second)
defer cancel()

Best Practices

Store API keys in environment variables:
Terminal window
```
export OPENAI_API_KEY="sk-..."
```
Always close providers:
```
defer provider.Close()
```
Use appropriate models for tasks:
- Simple: gpt-4o-mini, claude-haiku, llama 3.2 1B (vLLM/Ollama)
- Complex: gpt-4o, claude-sonnet, llama 3.1 8B (vLLM)
- Long context: gemini-1.5-pro
- Local development: ollama (easy setup)
- GPU-accelerated: vLLM (high throughput, guided decoding)

Monitor costs:

log.Printf("Cost: $%.6f", result.CostInfo.TotalCost)

Handle errors gracefully:

if err != nil {
    log.Printf("Provider error: %v", err)
    // Fallback or retry
}

Ollama & vLLM Setup

Ollama (Local Development)

import "github.com/AltairaLabs/PromptKit/runtime/providers/ollama"

provider := ollama.NewOllamaProvider(
    "ollama",
    "llama3.2:1b",
    "http://localhost:11434",
    ollama.DefaultProviderDefaults(),
    false,
    map[string]interface{}{
        "keep_alive": "5m",  // Keep model loaded
    },
)
defer provider.Close()

Setup:

# Install Ollama
brew install ollama  # macOS
# or visit https://ollama.ai

# Start server
ollama serve

# Pull a model
ollama pull llama3.2:1b

vLLM (High-Performance)

import "github.com/AltairaLabs/PromptKit/runtime/providers/vllm"

provider := vllm.NewVLLMProvider(
    "vllm",
    "meta-llama/Llama-3.2-3B-Instruct",
    "http://localhost:8000",
    vllm.DefaultProviderDefaults(),
    false,
    map[string]interface{}{
        "use_beam_search": false,
        "guided_json":     jsonSchema,  // Force structured output
    },
)
defer provider.Close()

Setup (GPU-accelerated):

docker run --rm --gpus all \
  -p 8000:8000 \
  vllm/vllm-openai:latest \
  --model meta-llama/Llama-3.2-3B-Instruct \
  --dtype half \
  --max-model-len 4096

Features:

Guided decoding (JSON schema, regex)
Beam search for quality
Multi-GPU tensor parallelism
High-throughput continuous batching

See Provider Reference for full vLLM configuration options.

Next Steps

Configure Pipeline - Build complete pipeline
Monitor Costs - Track spending
Switch Providers - Multi-provider strategies

Setup Providers

Goal

OpenAI Setup

Basic Setup

Environment Variables

Custom Configuration

Available Models

Claude Setup

Basic Setup

Environment Variables

Available Models

Gemini Setup

Basic Setup

Environment Variables

Available Models

Multi-Provider Setup

Provider Registry

Fallback Strategy

Cost Optimization

Model Selection by Task

Token Limits

Testing with Mock Provider

Custom Base URLs

Azure OpenAI

OpenAI-Compatible Endpoints

Troubleshooting

Authentication Errors

Rate Limiting

Timeout Errors

Best Practices

Ollama & vLLM Setup

Ollama (Local Development)

vLLM (High-Performance)

Next Steps

See Also