AI System Security Best Practices

Introduction

This document outlines the security best practices to be followed when implementing and maintaining the AI features of our Astro application. These guidelines are designed to ensure HIPAA compliance and protect sensitive data.

API Security

Authentication and Authorization

JWT Implementation
- Use short-lived JWT tokens (max 15 minutes)
- Implement token rotation with refresh tokens
- Store tokens securely using HttpOnly, Secure cookies
- Validate tokens on every request
- Include appropriate claims (sub, exp, iat, iss)
Role-Based Access Control
- Implement granular role definitions
- Apply principle of least privilege
- Use middleware for role validation
- Maintain centralized permission definitions
- Log access attempts and permission changes
Multi-Factor Authentication
- Require MFA for admin access
- Support FIDO2/WebAuthn for passwordless authentication
- Implement recovery methods securely
- Enforce MFA for sensitive operations
- Regularly audit MFA enrollment and usage

Input Validation

Request Validation
- Validate all input parameters using zod schemas
- Implement request size limits
- Use strict typing with TypeScript
- Validate content types and accept headers
- Sanitize inputs to prevent injection attacks
Rate Limiting
- Implement tiered rate limits based on user roles
- Use sliding window rate limiting
- Add exponential backoff for repeated failures
- Include clear rate limit headers
- Log rate limit violations
Error Handling
- Use generic error messages in production
- Log detailed errors privately
- Never expose stack traces
- Implement custom error pages
- Return appropriate HTTP status codes

AI-Specific Security

Data Protection

Prompt Security
- Sanitize prompts to prevent prompt injection
- Implement length limits on prompts
- Validate prompts against allowlists
- Apply content filtering
- Monitor prompt patterns for abuse
Response Filtering
- Filter AI responses for sensitive information
- Implement content detection for harmful output
- Apply custom blocklists for domain-specific concerns
- Log and alert on problematic responses
- Implement human review for flagged content
Model Access Control
- Restrict model access by user role
- Track all model calls with user attribution
- Implement fine-grained token quotas
- Configure model-specific permissions
- Audit all model access regularly

AI Usage Tracking

Logging
- Log all AI requests with pseudonymized user identifiers
- Track tokens used per request
- Implement structured logging for easy analysis
- Include request metadata (model, timestamp, context)
- Store logs in compliance with HIPAA requirements
Monitoring
- Track latency patterns for anomaly detection
- Monitor token usage for cost control
- Alert on unusual usage patterns
- Implement dashboards for real-time visibility
- Create daily usage reports
Auditing
- Maintain comprehensive audit trails
- Record all administrative actions
- Implement immutable audit logs
- Support audit log export for compliance
- Conduct regular audit reviews

Web Security

Security Headers

Content Security Policy

Content-Security-Policy: default-src 'self'; script-src 'self'; connect-src 'self' https://api.together.xyz; img-src 'self' data:; style-src 'self' 'unsafe-inline'; font-src 'self'; frame-src 'none'; object-src 'none'; base-uri 'self';

Additional Security Headers

X-Content-Type-Options: nosniff
X-Frame-Options: DENY
X-XSS-Protection: 1; mode=block
Strict-Transport-Security: max-age=31536000; includeSubDomains
Referrer-Policy: strict-origin-when-cross-origin
Permissions-Policy: camera=(), microphone=(), geolocation=()

CORS Configuration

Restrictive CORS Policy

// Example CORS configuration
export const corsOptions = {
  origin: ['https://yourdomain.com', /\.yourdomain\.com$/],
  methods: ['GET', 'POST', 'PUT', 'DELETE'],
  allowedHeaders: ['Content-Type', 'Authorization'],
  exposedHeaders: ['X-RateLimit-Limit', 'X-RateLimit-Remaining'],
  credentials: true,
  maxAge: 86400,
  optionsSuccessStatus: 204,
}

CORS Implementation
- Only allow necessary origins
- Restrict HTTP methods to those required
- Limit allowed headers
- Set appropriate max age
- Consider separate policies for different routes

HIPAA-Specific Requirements

Access Controls
- Implement role-based access controls
- Maintain access logs
- Review access periodically
- Implement automatic session timeout
- Restrict access to PHI to authorized personnel
Encryption
- Use TLS 1.3 for all communications
- Implement end-to-end encryption for sensitive data
- Apply proper key management procedures
- Encrypt data at rest using strong algorithms
- Implement secure key rotation
Audit Logging
- Log all access to PHI
- Include timestamp, user ID, action, and affected data
- Ensure tamper-proof logging
- Maintain logs for required retention period
- Implement log analysis for suspicious activities

Implementation Examples

Security Middleware

// Example security middleware
import { defineMiddleware } from 'astro:middleware'
import { isAuthenticated, hasRole } from '../lib/auth'

export const onRequest = defineMiddleware(
  async ({ request, locals, redirect }, next) => {
    // Apply security headers
    const response = await next()

    response.headers.set('X-Content-Type-Options', 'nosniff')
    response.headers.set('X-Frame-Options', 'DENY')
    response.headers.set('X-XSS-Protection', '1; mode=block')
    response.headers.set(
      'Strict-Transport-Security',
      'max-age=31536000; includeSubDomains',
    )
    response.headers.set('Referrer-Policy', 'strict-origin-when-cross-origin')

    // Apply Content Security Policy
    response.headers.set(
      'Content-Security-Policy',
      "default-src 'self'; script-src 'self'; connect-src 'self' https://api.together.xyz; img-src 'self' data:; style-src 'self' 'unsafe-inline'; font-src 'self'; frame-src 'none'; object-src 'none'; base-uri 'self';",
    )

    return response
  },
)

API Request Validation

// Example API request validation
import { z } from 'zod'
import type { APIRoute } from 'astro'

const CompletionSchema = z.object({
  prompt: z.string().min(1).max(4000),
  model: z.string().default('togethercomputer/llama-3-8b-instruct'),
  temperature: z.number().min(0).max(1).default(0.7),
  maxTokens: z.number().min(1).max(2048).default(512),
})

export const POST: APIRoute = async ({ request, locals }) => {
  // Validate authentication
  if (!locals.user) {
    return new Response(JSON.stringify({ error: 'Unauthorized' }), {
      status: 401,
      headers: { 'Content-Type': 'application/json' },
    })
  }

  // Validate request body
  let body
  try {
    body = await request.json()
  } catch (error) {
    return new Response(JSON.stringify({ error: 'Invalid JSON' }), {
      status: 400,
      headers: { 'Content-Type': 'application/json' },
    })
  }

  // Validate schema
  const result = CompletionSchema.safeParse(body)
  if (!result.success) {
    return new Response(
      JSON.stringify({
        error: 'Invalid request parameters',
        details: result.error.format(),
      }),
      {
        status: 400,
        headers: { 'Content-Type': 'application/json' },
      },
    )
  }

  // Log the AI request
  await locals.auditLog.create({
    userId: locals.user.id,
    action: 'ai.completion.create',
    details: {
      model: result.data.model,
      tokensRequested: result.data.maxTokens,
      temperature: result.data.temperature,
    },
  })

  // Process request
  // ...
}

Rate Limiting Implementation

// Example rate limiting middleware
import { Ratelimit } from '@upstash/ratelimit'
import { Redis } from '@upstash/redis'
import type { MiddlewareHandler } from 'astro:middleware'

// Create Redis client and rate limiter
const redis = new Redis({
  url: import.meta.env.REDIS_URL,
  token: import.meta.env.REDIS_TOKEN,
})

const ratelimit = new Ratelimit({
  redis,
  limiter: Ratelimit.slidingWindow(20, '1m'), // 20 requests per minute
  analytics: true,
  prefix: 'ai-api',
})

export const rateLimitMiddleware: MiddlewareHandler = async (
  { request, locals },
  next,
) => {
  // Skip rate limiting for non-API routes
  if (!request.url.includes('/api/')) {
    return next()
  }

  // Get client identifier (user ID or IP)
  const identifier =
    locals.user?.id || request.headers.get('x-forwarded-for') || 'anonymous'

  // Check rate limit
  const { success, limit, remaining, reset } = await ratelimit.limit(identifier)

  if (!success) {
    return new Response(JSON.stringify({ error: 'Too many requests' }), {
      status: 429,
      headers: {
        'Content-Type': 'application/json',
        'X-RateLimit-Limit': limit.toString(),
        'X-RateLimit-Remaining': remaining.toString(),
        'X-RateLimit-Reset': reset.toString(),
      },
    })
  }

  // Continue to the route handler
  const response = await next()

  // Add rate limit headers to response
  response.headers.set('X-RateLimit-Limit', limit.toString())
  response.headers.set('X-RateLimit-Remaining', remaining.toString())
  response.headers.set('X-RateLimit-Reset', reset.toString())

  return response
}

Security Testing

Automated Testing

Regular Penetration Testing
- Run the security test suite weekly
- Include endpoint security tests
- Test authentication bypass scenarios
- Scan for web vulnerabilities
- Document and address findings promptly
Integration with CI/CD
- Include security tests in CI/CD pipeline
- Fail builds for critical security issues
- Implement security gates for deployment
- Generate security reports automatically
- Track security metrics over time

Manual Testing

Code Reviews
- Conduct security-focused code reviews
- Use a security checklist for all PRs
- Involve security champions in reviews
- Verify security-sensitive implementations
- Document security decisions
Penetration Testing
- Conduct manual penetration testing quarterly
- Include AI-specific attack vectors
- Test for prompt injection
- Verify rate limiting effectiveness
- Assess authentication controls

Incident Response

Preparation
- Document incident response procedures
- Assign incident response roles
- Create communication templates
- Establish escalation paths
- Maintain contact information
Detection and Analysis
- Implement monitoring for suspicious activities
- Create alerts for security anomalies
- Document incident severity classifications
- Establish investigation procedures
- Train staff on incident identification
Containment and Eradication
- Document containment strategies
- Establish evidence collection procedures
- Create recovery steps for common incidents
- Define success criteria for remediation
- Document lessons learned process

Conclusion

Following these security best practices will help ensure that our AI system implementation meets HIPAA compliance requirements and provides strong protection for sensitive data. Regular security reviews and updates to these practices are essential to maintain a strong security posture as threats evolve.

Overview

Security Protocols

Compliance

Security Analysis

Security best practices

AI System Security Best Practices

Introduction

API Security

Authentication and Authorization

Input Validation

AI-Specific Security

Data Protection

AI Usage Tracking

Web Security

Security Headers

CORS Configuration

HIPAA-Specific Requirements

Implementation Examples

Security Middleware

API Request Validation

Rate Limiting Implementation

Security Testing

Automated Testing

Manual Testing

Incident Response

Conclusion

Overview

Security Protocols

Compliance

Security Analysis

​AI System Security Best Practices

​Introduction

​API Security

​Authentication and Authorization

​Input Validation

​AI-Specific Security

​Data Protection

​AI Usage Tracking

​Web Security

​Security Headers

​CORS Configuration

​HIPAA-Specific Requirements

​Implementation Examples

​Security Middleware

​API Request Validation

​Rate Limiting Implementation

​Security Testing

​Automated Testing

​Manual Testing

​Incident Response

​Conclusion

AI System Security Best Practices

Introduction

API Security

Authentication and Authorization

Input Validation

AI-Specific Security

Data Protection

AI Usage Tracking

Web Security

Security Headers

CORS Configuration

HIPAA-Specific Requirements

Implementation Examples

Security Middleware

API Request Validation

Rate Limiting Implementation

Security Testing

Automated Testing

Manual Testing

Incident Response

Conclusion