Spaces:

Thadillo
/

participatory-planner

Sleeping

File size: 73,837 Bytes

from flask import Blueprint, render_template, request, redirect, url_for, session, flash, jsonify, send_file
from app.models.models import Token, Submission, Settings, TrainingExample, FineTuningRun, SubmissionSentence
from app import db
from app.analyzer import get_analyzer
from app.utils.pdf_export import DashboardPDFExporter
from functools import wraps
from typing import Dict
import json
import csv
import io
from datetime import datetime
import os
import logging

logger = logging.getLogger(__name__)

bp = Blueprint('admin', __name__, url_prefix='/admin')

CONTRIBUTOR_TYPES = [
    {'value': 'government', 'label': 'Government Officer', 'description': 'Public sector representatives'},
    {'value': 'community', 'label': 'Community Member', 'description': 'Local residents and community leaders'},
    {'value': 'industry', 'label': 'Industry Representative', 'description': 'Business and industry stakeholders'},
    {'value': 'ngo', 'label': 'NGO/Non-Profit', 'description': 'Civil society organizations'},
    {'value': 'academic', 'label': 'Academic/Researcher', 'description': 'Universities and research institutions'},
    {'value': 'other', 'label': 'Other Stakeholder', 'description': 'Other interested parties'}
]

CATEGORIES = ['Vision', 'Problem', 'Objectives', 'Directives', 'Values', 'Actions']

def admin_required(f):
    @wraps(f)
    def decorated_function(*args, **kwargs):
        if 'token' not in session or session.get('type') != 'admin':
            return redirect(url_for('auth.login'))
        return f(*args, **kwargs)
    return decorated_function

@bp.route('/overview')
@admin_required
def overview():
    total_submissions = Submission.query.count()
    total_tokens = Token.query.filter(Token.type != 'admin').count()
    flagged_count = Submission.query.filter_by(flagged_as_offensive=True).count()
    unanalyzed_count = Submission.query.filter_by(category=None).count()

    submission_open = Settings.get_setting('submission_open', 'true') == 'true'
    token_generation_enabled = Settings.get_setting('token_generation_enabled', 'true') == 'true'

    analyzed = Submission.query.filter(Submission.category != None).count() > 0

    return render_template('admin/overview.html',
                         total_submissions=total_submissions,
                         total_tokens=total_tokens,
                         flagged_count=flagged_count,
                         unanalyzed_count=unanalyzed_count,
                         submission_open=submission_open,
                         token_generation_enabled=token_generation_enabled,
                         analyzed=analyzed)

@bp.route('/registration')
@admin_required
def registration():
    token_generation_enabled = Settings.get_setting('token_generation_enabled', 'true') == 'true'
    recent_tokens = Token.query.filter(Token.type != 'admin').order_by(Token.created_at.desc()).limit(10).all()

    registration_url = request.host_url.rstrip('/') + url_for('auth.generate')

    return render_template('admin/registration.html',
                         token_generation_enabled=token_generation_enabled,
                         recent_tokens=recent_tokens,
                         registration_url=registration_url)

@bp.route('/tokens')
@admin_required
def tokens():
    all_tokens = Token.query.all()
    return render_template('admin/tokens.html',
                         tokens=all_tokens,
                         contributor_types=CONTRIBUTOR_TYPES)

@bp.route('/submissions')
@admin_required
def submissions():
    category_filter = request.args.get('category', 'all')
    flagged_only = request.args.get('flagged', 'false') == 'true'

    query = Submission.query

    if category_filter != 'all':
        query = query.filter_by(category=category_filter)

    if flagged_only:
        query = query.filter_by(flagged_as_offensive=True)

    all_submissions = query.order_by(Submission.timestamp.desc()).all()
    flagged_count = Submission.query.filter_by(flagged_as_offensive=True).count()

    analyzed = Submission.query.filter(Submission.category != None).count() > 0

    return render_template('admin/submissions.html',
                         submissions=all_submissions,
                         categories=CATEGORIES,
                         category_filter=category_filter,
                         flagged_only=flagged_only,
                         flagged_count=flagged_count,
                         analyzed=analyzed)

@bp.route('/dashboard')
@admin_required
def dashboard():
    # Check if analyzed
    analyzed = Submission.query.filter(Submission.category != None).count() > 0

    if not analyzed:
        flash('Please analyze submissions first', 'warning')
        return redirect(url_for('admin.overview'))

    # Get view mode from query param ('submissions' or 'sentences')
    view_mode = request.args.get('mode', 'submissions')

    # Contributor stats (unchanged - always submission-based)
    contributor_stats = db.session.query(
        Submission.contributor_type,
        db.func.count(Submission.id)
    ).group_by(Submission.contributor_type).all()

    # MODE DEPENDENT: Data changes based on sentence vs submission view
    if view_mode == 'sentences':
        # SENTENCE-LEVEL VIEW

        # Get all sentences with categories joined with their parent submissions
        sentences_query = db.session.query(SubmissionSentence, Submission).join(
            Submission
        ).filter(
            SubmissionSentence.category != None
        ).all()

        # Create enhanced sentence objects with submission data
        sentences = []
        for sentence, submission in sentences_query:
            # Create object with both sentence and submission attributes
            class EnhancedSentence:
                def __init__(self, sentence, submission):
                    self.id = sentence.id
                    self.text = sentence.text
                    self.message = sentence.text  # For template compatibility
                    self.category = sentence.category
                    self.confidence = sentence.confidence
                    self.contributor_type = submission.contributor_type
                    self.timestamp = submission.timestamp
                    self.latitude = submission.latitude
                    self.longitude = submission.longitude
                    self.submission_id = submission.id

            sentences.append(EnhancedSentence(sentence, submission))

        # Category stats
        category_stats = db.session.query(
            SubmissionSentence.category,
            db.func.count(SubmissionSentence.id)
        ).filter(SubmissionSentence.category != None).group_by(SubmissionSentence.category).all()

        # Breakdown by contributor (via parent submission)
        breakdown = {}
        for cat in CATEGORIES:
            breakdown[cat] = {}
            for ctype in CONTRIBUTOR_TYPES:
                count = db.session.query(db.func.count(SubmissionSentence.id)).join(
                    Submission
                ).filter(
                    SubmissionSentence.category == cat,
                    Submission.contributor_type == ctype['value']
                ).scalar()
                breakdown[cat][ctype['value']] = count

        # Geotagged sentences (inherit location from parent submission)
        geotagged_items = db.session.query(SubmissionSentence, Submission).join(
            Submission
        ).filter(
            Submission.latitude != None,
            Submission.longitude != None,
            SubmissionSentence.category != None
        ).all()

        # Create sentence objects with location data
        geotagged_data = []
        for sentence, submission in geotagged_items:
            # Create a pseudo-object that has both sentence and location data
            class SentenceWithLocation:
                def __init__(self, sentence, submission):
                    self.id = sentence.id
                    self.text = sentence.text
                    self.category = sentence.category
                    self.latitude = submission.latitude
                    self.longitude = submission.longitude
                    self.contributor_type = submission.contributor_type
                    self.timestamp = submission.timestamp
                    self.message = sentence.text  # For compatibility

            geotagged_data.append(SentenceWithLocation(sentence, submission))

        # Items for contributions list (sentences)
        items_by_category = sentences

    else:
        # SUBMISSION-LEVEL VIEW (default)

        # Get all submissions with categories
        submissions = Submission.query.filter(Submission.category != None).all()

        # Category stats
        category_stats = db.session.query(
            Submission.category,
            db.func.count(Submission.id)
        ).filter(Submission.category != None).group_by(Submission.category).all()

        # Breakdown by contributor type
        breakdown = {}
        for cat in CATEGORIES:
            breakdown[cat] = {}
            for ctype in CONTRIBUTOR_TYPES:
                count = Submission.query.filter_by(
                    category=cat,
                    contributor_type=ctype['value']
                ).count()
                breakdown[cat][ctype['value']] = count

        # Geotagged submissions
        geotagged_data = Submission.query.filter(
            Submission.latitude != None,
            Submission.longitude != None,
            Submission.category != None
        ).all()

        # Items for contributions list (submissions)
        items_by_category = submissions

    return render_template('admin/dashboard.html',
                         items=items_by_category,
                         contributor_stats=contributor_stats,
                         category_stats=category_stats,
                         geotagged_items=geotagged_data,
                         categories=CATEGORIES,
                         contributor_types=CONTRIBUTOR_TYPES,
                         breakdown=breakdown,
                         view_mode=view_mode)

@bp.route('/dashboard/export-pdf')
@admin_required
def export_dashboard_pdf():
    """Export dashboard data as PDF based on view mode"""
    try:
        # Get view mode
        view_mode = request.args.get('mode', 'submissions')

        # Contributor stats
        contributor_stats = db.session.query(
            Submission.contributor_type,
            db.func.count(Submission.id)
        ).group_by(Submission.contributor_type).all()

        # MODE DEPENDENT: Same logic as dashboard
        if view_mode == 'sentences':
            # SENTENCE-LEVEL VIEW

            # Get all sentences with categories joined with their parent submissions
            sentences_query = db.session.query(SubmissionSentence, Submission).join(
                Submission
            ).filter(
                SubmissionSentence.category != None
            ).all()

            # Create enhanced sentence objects with submission data
            sentences = []
            for sentence, submission in sentences_query:
                class EnhancedSentence:
                    def __init__(self, sentence, submission):
                        self.id = sentence.id
                        self.text = sentence.text
                        self.message = sentence.text  # For template compatibility
                        self.category = sentence.category
                        self.confidence = sentence.confidence
                        self.contributor_type = submission.contributor_type
                        self.timestamp = submission.timestamp
                        self.latitude = submission.latitude
                        self.longitude = submission.longitude
                        self.submission_id = submission.id

                sentences.append(EnhancedSentence(sentence, submission))

            # Category stats
            category_stats = db.session.query(
                SubmissionSentence.category,
                db.func.count(SubmissionSentence.id)
            ).filter(SubmissionSentence.category != None).group_by(SubmissionSentence.category).all()

            # Breakdown by contributor
            breakdown = {}
            for cat in CATEGORIES:
                breakdown[cat] = {}
                for ctype in CONTRIBUTOR_TYPES:
                    count = db.session.query(db.func.count(SubmissionSentence.id)).join(
                        Submission
                    ).filter(
                        SubmissionSentence.category == cat,
                        Submission.contributor_type == ctype['value']
                    ).scalar()
                    breakdown[cat][ctype['value']] = count

            # Geotagged sentences (inherit location from parent submission)
            geotagged_items = db.session.query(SubmissionSentence, Submission).join(
                Submission
            ).filter(
                Submission.latitude != None,
                Submission.longitude != None,
                SubmissionSentence.category != None
            ).all()

            # Create sentence objects with location data
            geotagged_data = []
            for sentence, submission in geotagged_items:
                class SentenceWithLocation:
                    def __init__(self, sentence, submission):
                        self.id = sentence.id
                        self.text = sentence.text
                        self.category = sentence.category
                        self.latitude = submission.latitude
                        self.longitude = submission.longitude
                        self.contributor_type = submission.contributor_type
                        self.timestamp = submission.timestamp
                        self.message = sentence.text

                geotagged_data.append(SentenceWithLocation(sentence, submission))

            # Items for contributions list
            items_list = sentences

        else:
            # SUBMISSION-LEVEL VIEW

            # Get all submissions with categories
            submissions = Submission.query.filter(Submission.category != None).all()

            # Category stats
            category_stats = db.session.query(
                Submission.category,
                db.func.count(Submission.id)
            ).filter(Submission.category != None).group_by(Submission.category).all()

            # Breakdown by contributor
            breakdown = {}
            for cat in CATEGORIES:
                breakdown[cat] = {}
                for ctype in CONTRIBUTOR_TYPES:
                    count = Submission.query.filter_by(
                        category=cat,
                        contributor_type=ctype['value']
                    ).count()
                    breakdown[cat][ctype['value']] = count

            # Geotagged submissions
            geotagged_data = Submission.query.filter(
                Submission.latitude != None,
                Submission.longitude != None,
                Submission.category != None
            ).all()

            # Items for contributions list
            items_list = submissions

        # Prepare data for PDF
        pdf_data = {
            'submissions': items_list,  # Can be sentences or submissions
            'category_stats': category_stats,
            'contributor_stats': contributor_stats,
            'breakdown': breakdown,
            'geotagged_submissions': geotagged_data,
            'view_mode': view_mode,
            'categories': CATEGORIES,
            'contributor_types': CONTRIBUTOR_TYPES
        }

        # Generate PDF
        buffer = io.BytesIO()
        exporter = DashboardPDFExporter()
        exporter.generate_pdf(buffer, pdf_data)
        buffer.seek(0)

        # Generate filename
        mode_label = "sentence" if view_mode == 'sentences' else "submission"
        filename = f"dashboard_{mode_label}_{datetime.now().strftime('%Y%m%d_%H%M%S')}.pdf"

        return send_file(
            buffer,
            mimetype='application/pdf',
            as_attachment=True,
            download_name=filename
        )

    except Exception as e:
        logger.error(f"Error exporting dashboard PDF: {str(e)}")
        flash(f'Error exporting PDF: {str(e)}', 'danger')
        return redirect(url_for('admin.dashboard'))

# API Endpoints

@bp.route('/api/toggle-submissions', methods=['POST'])
@admin_required
def toggle_submissions():
    current = Settings.get_setting('submission_open', 'true')
    new_value = 'false' if current == 'true' else 'true'
    Settings.set_setting('submission_open', new_value)
    return jsonify({'success': True, 'submission_open': new_value == 'true'})

@bp.route('/api/toggle-token-generation', methods=['POST'])
@admin_required
def toggle_token_generation():
    current = Settings.get_setting('token_generation_enabled', 'true')
    new_value = 'false' if current == 'true' else 'true'
    Settings.set_setting('token_generation_enabled', new_value)
    return jsonify({'success': True, 'token_generation_enabled': new_value == 'true'})

@bp.route('/api/create-token', methods=['POST'])
@admin_required
def create_token():
    data = request.json
    contributor_type = data.get('type')
    name = data.get('name', '').strip()

    # Allow 'admin' type in addition to contributor types
    valid_types = [t['value'] for t in CONTRIBUTOR_TYPES] + ['admin']
    if not contributor_type or contributor_type not in valid_types:
        return jsonify({'success': False, 'error': 'Invalid contributor type'}), 400

    import random
    import string

    prefix = contributor_type[:3].upper()
    random_part = ''.join(random.choices(string.ascii_uppercase + string.digits, k=6))
    timestamp_part = str(int(datetime.now().timestamp()))[-4:]
    token_str = f"{prefix}-{random_part}{timestamp_part}"

    # Default name based on type
    if contributor_type == 'admin':
        final_name = name if name else "Administrator"
    else:
        final_name = name if name else f"{contributor_type.capitalize()} User"

    new_token = Token(
        token=token_str,
        type=contributor_type,
        name=final_name
    )

    db.session.add(new_token)
    db.session.commit()

    return jsonify({'success': True, 'token': new_token.to_dict()})

@bp.route('/api/delete-token/<int:token_id>', methods=['DELETE'])
@admin_required
def delete_token(token_id):
    token = Token.query.get_or_404(token_id)

    # Prevent deletion of admin tokens (any token with type='admin')
    if token.type == 'admin':
        return jsonify({'success': False, 'error': 'Cannot delete admin token'}), 400

    db.session.delete(token)
    db.session.commit()

    return jsonify({'success': True})

@bp.route('/api/update-category/<int:submission_id>', methods=['POST'])
@admin_required
def update_category(submission_id):
    try:
        submission = Submission.query.get_or_404(submission_id)
        data = request.json
        category = data.get('category')
        confidence = data.get('confidence')  # Optional: frontend can pass prediction confidence

        # Store original category before change
        original_category = submission.category

        # Convert empty string to None
        if category == '' or category == 'null':
            category = None

        # Validate category if not None
        if category and category not in CATEGORIES:
            return jsonify({'success': False, 'error': f'Invalid category: {category}'}), 400

        # Create training example if admin is making a correction or confirmation
        if category is not None:  # Only track when assigning a category
            # Check if training example already exists for this submission
            existing_example = TrainingExample.query.filter_by(submission_id=submission_id).first()

            if existing_example:
                # Update existing example
                existing_example.original_category = original_category
                existing_example.corrected_category = category
                existing_example.correction_timestamp = datetime.utcnow()
                existing_example.confidence_score = confidence
            else:
                # Create new training example
                training_example = TrainingExample(
                    submission_id=submission_id,
                    message=submission.message,
                    original_category=original_category,
                    corrected_category=category,
                    contributor_type=submission.contributor_type,
                    confidence_score=confidence
                )
                db.session.add(training_example)

        # Update submission category
        submission.category = category
        db.session.commit()

        return jsonify({'success': True, 'category': category})

    except Exception as e:
        db.session.rollback()
        print(f"Error updating category: {str(e)}")
        return jsonify({'success': False, 'error': str(e)}), 500

@bp.route('/api/update-sentence-category/<int:sentence_id>', methods=['POST'])
@admin_required
def update_sentence_category(sentence_id):
    """Update category for a specific sentence"""
    try:
        sentence = SubmissionSentence.query.get_or_404(sentence_id)
        data = request.json
        new_category = data.get('category')
        
        # Store original
        original_category = sentence.category
        
        # Validate category
        if new_category and new_category not in CATEGORIES:
            return jsonify({'success': False, 'error': f'Invalid category: {new_category}'}), 400
        
        # Update sentence
        sentence.category = new_category
        
        # Create/update training example for this sentence
        if new_category:
            existing = TrainingExample.query.filter_by(sentence_id=sentence_id).first()
            
            if existing:
                existing.original_category = original_category
                existing.corrected_category = new_category
                existing.correction_timestamp = datetime.utcnow()
            else:
                training_example = TrainingExample(
                    sentence_id=sentence_id,
                    submission_id=sentence.submission_id,
                    message=sentence.text,  # Just the sentence text
                    original_category=original_category,
                    corrected_category=new_category,
                    contributor_type=sentence.submission.contributor_type
                )
                db.session.add(training_example)
        
        # Update parent submission's primary category (recalculate from sentences)
        submission = sentence.submission
        submission.category = submission.get_primary_category()
        
        db.session.commit()
        
        return jsonify({'success': True, 'category': new_category})
    
    except Exception as e:
        db.session.rollback()
        logger.error(f"Error updating sentence category: {str(e)}")
        return jsonify({'success': False, 'error': str(e)}), 500

@bp.route('/api/toggle-flag/<int:submission_id>', methods=['POST'])
@admin_required
def toggle_flag(submission_id):
    submission = Submission.query.get_or_404(submission_id)
    submission.flagged_as_offensive = not submission.flagged_as_offensive
    db.session.commit()
    return jsonify({'success': True, 'flagged': submission.flagged_as_offensive})

@bp.route('/api/delete-submission/<int:submission_id>', methods=['DELETE'])
@admin_required
def delete_submission(submission_id):
    submission = Submission.query.get_or_404(submission_id)
    db.session.delete(submission)
    db.session.commit()
    return jsonify({'success': True})

@bp.route('/api/analyze', methods=['POST'])
@admin_required
def analyze_submissions():
    import time
    from sqlalchemy.exc import OperationalError

    data = request.json
    analyze_all = data.get('analyze_all', False)
    use_sentences = data.get('use_sentences', True)  # NEW: sentence-level flag (default: True)

    # Get submissions to analyze
    if analyze_all:
        to_analyze = Submission.query.all()
    else:
        # For sentence-level, look for submissions without sentence analysis
        if use_sentences:
            to_analyze = Submission.query.filter_by(sentence_analysis_done=False).all()
        else:
            to_analyze = Submission.query.filter_by(category=None).all()

    if not to_analyze:
        return jsonify({'success': False, 'error': 'No submissions to analyze'}), 400

    # Get the analyzer instance
    analyzer = get_analyzer()

    success_count = 0
    error_count = 0
    batch_size = 10  # Commit every 10 submissions to reduce lock time

    for idx, submission in enumerate(to_analyze):
        max_retries = 3
        retry_delay = 1  # seconds

        for attempt in range(max_retries):
            try:
                if use_sentences:
                    # NEW: Sentence-level analysis
                    sentence_results = analyzer.analyze_with_sentences(submission.message)

                    # Optimized DELETE: Use synchronize_session=False for better performance
                    SubmissionSentence.query.filter_by(submission_id=submission.id).delete(synchronize_session=False)

                    # Create new sentence records
                    for sent_idx, result in enumerate(sentence_results):
                        sentence = SubmissionSentence(
                            submission_id=submission.id,
                            sentence_index=sent_idx,
                            text=result['text'],
                            category=result['category'],
                            confidence=result.get('confidence')
                        )
                        db.session.add(sentence)

                    submission.sentence_analysis_done = True
                    # Set primary category for backward compatibility
                    submission.category = submission.get_primary_category()

                    logger.info(f"Analyzed submission {submission.id} into {len(sentence_results)} sentences")
                else:
                    # OLD: Submission-level analysis (backward compatible)
                    category = analyzer.analyze(submission.message)
                    submission.category = category

                success_count += 1

                # Commit in batches to reduce lock duration
                if (idx + 1) % batch_size == 0:
                    db.session.commit()
                    logger.info(f"Committed batch of {batch_size} submissions")

                break  # Success, exit retry loop

            except OperationalError as e:
                # Database locked error - retry with exponential backoff
                if 'database is locked' in str(e) and attempt < max_retries - 1:
                    db.session.rollback()
                    wait_time = retry_delay * (2 ** attempt)  # Exponential backoff
                    logger.warning(f"Database locked for submission {submission.id}, retrying in {wait_time}s (attempt {attempt + 1}/{max_retries})")
                    time.sleep(wait_time)
                    continue
                else:
                    # Max retries reached or different error
                    db.session.rollback()
                    logger.error(f"Error analyzing submission {submission.id}: {e}")
                    error_count += 1
                    break

            except Exception as e:
                db.session.rollback()
                logger.error(f"Error analyzing submission {submission.id}: {e}")
                error_count += 1
                break

    # Final commit for remaining items
    try:
        db.session.commit()
        logger.info(f"Final commit completed")
    except Exception as e:
        db.session.rollback()
        logger.error(f"Error in final commit: {e}")

    return jsonify({
        'success': True,
        'analyzed': success_count,
        'errors': error_count,
        'sentence_level': use_sentences
    })

@bp.route('/export/json')
@admin_required
def export_json():
    data = {
        'tokens': [t.to_dict() for t in Token.query.all()],
        'submissions': [s.to_dict() for s in Submission.query.all()],
        'trainingExamples': [ex.to_dict() for ex in TrainingExample.query.all()],
        'submissionOpen': Settings.get_setting('submission_open', 'true') == 'true',
        'tokenGenerationEnabled': Settings.get_setting('token_generation_enabled', 'true') == 'true',
        'exportDate': datetime.utcnow().isoformat()
    }

    json_str = json.dumps(data, indent=2)

    buffer = io.BytesIO()
    buffer.write(json_str.encode('utf-8'))
    buffer.seek(0)

    return send_file(
        buffer,
        mimetype='application/json',
        as_attachment=True,
        download_name=f'participatory-planning-{datetime.now().strftime("%Y-%m-%d")}.json'
    )

@bp.route('/export/csv')
@admin_required
def export_csv():
    submissions = Submission.query.all()

    output = io.StringIO()
    writer = csv.writer(output)

    # Header
    writer.writerow(['Timestamp', 'Contributor Type', 'Category', 'Message', 'Latitude', 'Longitude', 'Flagged'])

    # Rows
    for s in submissions:
        writer.writerow([
            s.timestamp.isoformat() if s.timestamp else '',
            s.contributor_type,
            s.category or 'Not analyzed',
            s.message,
            s.latitude or '',
            s.longitude or '',
            'Yes' if s.flagged_as_offensive else 'No'
        ])

    buffer = io.BytesIO()
    buffer.write(output.getvalue().encode('utf-8'))
    buffer.seek(0)

    return send_file(
        buffer,
        mimetype='text/csv',
        as_attachment=True,
        download_name=f'contributions-{datetime.now().strftime("%Y-%m-%d")}.csv'
    )

@bp.route('/import', methods=['POST'])
@admin_required
def import_data():
    if 'file' not in request.files:
        return jsonify({'success': False, 'error': 'No file uploaded'}), 400

    file = request.files['file']

    if file.filename == '':
        return jsonify({'success': False, 'error': 'No file selected'}), 400

    try:
        data = json.load(file)

        # Clear existing data (except admin token)
        Submission.query.delete()
        Token.query.filter(Token.type != 'admin').delete()

        # Import tokens
        for token_data in data.get('tokens', []):
            if token_data.get('type') != 'admin':  # Skip admin token as it already exists
                token = Token(
                    token=token_data['token'],
                    type=token_data['type'],
                    name=token_data['name']
                )
                db.session.add(token)

        # Import submissions
        for sub_data in data.get('submissions', []):
            location = sub_data.get('location')
            submission = Submission(
                message=sub_data['message'],
                contributor_type=sub_data['contributorType'],
                latitude=location['lat'] if location else None,
                longitude=location['lng'] if location else None,
                timestamp=datetime.fromisoformat(sub_data['timestamp']) if sub_data.get('timestamp') else datetime.utcnow(),
                category=sub_data.get('category'),
                flagged_as_offensive=sub_data.get('flaggedAsOffensive', False)
            )
            db.session.add(submission)

        # Import training examples if present
        training_examples_imported = 0
        for ex_data in data.get('trainingExamples', []):
            # Find corresponding submission by message (or create placeholder)
            submission = Submission.query.filter_by(message=ex_data['message']).first()
            if submission:
                training_example = TrainingExample(
                    submission_id=submission.id,
                    message=ex_data['message'],
                    original_category=ex_data.get('original_category'),
                    corrected_category=ex_data['corrected_category'],
                    contributor_type=ex_data['contributor_type'],
                    correction_timestamp=datetime.fromisoformat(ex_data['correction_timestamp']) if ex_data.get('correction_timestamp') else datetime.utcnow(),
                    confidence_score=ex_data.get('confidence_score'),
                    used_in_training=ex_data.get('used_in_training', False)
                )
                db.session.add(training_example)
                training_examples_imported += 1

        # Import settings
        Settings.set_setting('submission_open', 'true' if data.get('submissionOpen', True) else 'false')
        Settings.set_setting('token_generation_enabled', 'true' if data.get('tokenGenerationEnabled', True) else 'false')

        db.session.commit()

        return jsonify({
            'success': True,
            'training_examples_imported': training_examples_imported
        })

    except Exception as e:
        db.session.rollback()
        return jsonify({'success': False, 'error': str(e)}), 500

@bp.route('/api/clear-all-data', methods=['POST'])
@admin_required
def clear_all_data():
    """Clear all submissions and tokens (except admin)"""
    try:
        # Delete all submissions
        Submission.query.delete()

        # Delete all tokens except admin
        Token.query.filter(Token.type != 'admin').delete()

        # Optionally reset settings to defaults
        Settings.set_setting('submission_open', 'true')
        Settings.set_setting('token_generation_enabled', 'true')

        db.session.commit()

        return jsonify({'success': True, 'message': 'All data cleared successfully'})

    except Exception as e:
        db.session.rollback()
        return jsonify({'success': False, 'error': str(e)}), 500


# ============================================================================
# FINE-TUNING & TRAINING DATA ENDPOINTS
# ============================================================================

@bp.route('/training')
@admin_required
def training_dashboard():
    """Display the fine-tuning training dashboard"""
    # Get training statistics
    total_examples = TrainingExample.query.count()
    corrections_count = TrainingExample.query.filter(
        TrainingExample.original_category != TrainingExample.corrected_category
    ).count()
    confirmations_count = total_examples - corrections_count

    # Category distribution
    from sqlalchemy import func
    category_distribution = db.session.query(
        TrainingExample.corrected_category,
        func.count(TrainingExample.id)
    ).group_by(TrainingExample.corrected_category).all()

    category_stats = {cat: 0 for cat in CATEGORIES}
    for cat, count in category_distribution:
        if cat in category_stats:
            category_stats[cat] = count

    # Get all training runs
    training_runs = FineTuningRun.query.order_by(FineTuningRun.created_at.desc()).all()

    # Get active model
    active_model = FineTuningRun.query.filter_by(is_active_model=True).first()

    # Fine-tuning settings
    min_training_examples = int(Settings.get_setting('min_training_examples', '20'))
    fine_tuning_enabled = Settings.get_setting('fine_tuning_enabled', 'true') == 'true'

    return render_template('admin/training.html',
                         total_examples=total_examples,
                         corrections_count=corrections_count,
                         confirmations_count=confirmations_count,
                         category_stats=category_stats,
                         categories=CATEGORIES,
                         training_runs=training_runs,
                         active_model=active_model,
                         min_training_examples=min_training_examples,
                         fine_tuning_enabled=fine_tuning_enabled,
                         ready_to_train=total_examples >= min_training_examples)


@bp.route('/api/training-stats', methods=['GET'])
@admin_required
def get_training_stats():
    """Get training data statistics (API endpoint)"""
    total_examples = TrainingExample.query.count()
    corrections_count = TrainingExample.query.filter(
        TrainingExample.original_category != TrainingExample.corrected_category
    ).count()

    # Category distribution
    from sqlalchemy import func
    category_distribution = db.session.query(
        TrainingExample.corrected_category,
        func.count(TrainingExample.id)
    ).group_by(TrainingExample.corrected_category).all()

    category_stats = {cat: 0 for cat in CATEGORIES}
    for cat, count in category_distribution:
        if cat in category_stats:
            category_stats[cat] = count

    # Check for data quality issues
    duplicates = db.session.query(
        TrainingExample.message,
        func.count(TrainingExample.id)
    ).group_by(TrainingExample.message).having(func.count(TrainingExample.id) > 1).count()

    min_examples = int(Settings.get_setting('min_training_examples', '20'))
    min_per_category = min(category_stats.values()) if category_stats.values() else 0

    return jsonify({
        'total_examples': total_examples,
        'corrections_count': corrections_count,
        'confirmations_count': total_examples - corrections_count,
        'category_stats': category_stats,
        'duplicates_count': duplicates,
        'min_examples_threshold': min_examples,
        'min_examples_per_category': min_per_category,
        'ready_to_train': total_examples >= min_examples and min_per_category >= 2
    })


@bp.route('/api/training-examples', methods=['GET'])
@admin_required
def get_training_examples():
    """Get all training examples"""
    page = request.args.get('page', 1, type=int)
    per_page = request.args.get('per_page', 50, type=int)
    category_filter = request.args.get('category', 'all')
    corrections_only = request.args.get('corrections_only', 'false') == 'true'

    query = TrainingExample.query

    if category_filter != 'all':
        query = query.filter_by(corrected_category=category_filter)

    if corrections_only:
        query = query.filter(TrainingExample.original_category != TrainingExample.corrected_category)

    query = query.order_by(TrainingExample.correction_timestamp.desc())

    pagination = query.paginate(page=page, per_page=per_page, error_out=False)

    return jsonify({
        'examples': [ex.to_dict() for ex in pagination.items],
        'total': pagination.total,
        'pages': pagination.pages,
        'current_page': page
    })


@bp.route('/api/training-example/<int:example_id>', methods=['DELETE'])
@admin_required
def delete_training_example(example_id):
    """Delete a training example"""
    try:
        example = TrainingExample.query.get_or_404(example_id)

        # Don't allow deleting if already used in training
        if example.used_in_training:
            return jsonify({
                'success': False,
                'error': 'Cannot delete example already used in training run'
            }), 400

        db.session.delete(example)
        db.session.commit()

        return jsonify({'success': True})

    except Exception as e:
        db.session.rollback()
        return jsonify({'success': False, 'error': str(e)}), 500


@bp.route('/api/export-training-examples', methods=['GET'])
@admin_required
def export_training_examples():
    """Export all training examples as JSON"""
    try:
        # Get filter parameters
        sentence_level_only = request.args.get('sentence_level_only', 'false') == 'true'

        # Query examples
        query = TrainingExample.query
        if sentence_level_only:
            query = query.filter(TrainingExample.sentence_id != None)

        examples = query.all()

        # Export data
        export_data = {
            'exported_at': datetime.utcnow().isoformat(),
            'total_examples': len(examples),
            'sentence_level_only': sentence_level_only,
            'examples': [
                {
                    'message': ex.message,
                    'original_category': ex.original_category,
                    'corrected_category': ex.corrected_category,
                    'contributor_type': ex.contributor_type,
                    'correction_timestamp': ex.correction_timestamp.isoformat() if ex.correction_timestamp else None,
                    'confidence_score': ex.confidence_score,
                    'is_sentence_level': ex.sentence_id is not None
                }
                for ex in examples
            ]
        }

        # Return as downloadable JSON file
        response = jsonify(export_data)
        response.headers['Content-Disposition'] = f'attachment; filename=training_examples_{datetime.utcnow().strftime("%Y%m%d_%H%M%S")}.json'
        response.headers['Content-Type'] = 'application/json'

        return response

    except Exception as e:
        return jsonify({'success': False, 'error': str(e)}), 500


@bp.route('/api/import-training-examples', methods=['POST'])
@admin_required
def import_training_examples():
    """Import training examples from JSON file"""
    try:
        # Get JSON data from request
        data = request.get_json()

        if not data or 'examples' not in data:
            return jsonify({
                'success': False,
                'error': 'Invalid import data. Expected JSON with "examples" array.'
            }), 400

        examples_data = data['examples']
        imported_count = 0
        skipped_count = 0

        for ex_data in examples_data:
            # Check if example already exists (by message and category)
            existing = TrainingExample.query.filter_by(
                message=ex_data['message'],
                corrected_category=ex_data['corrected_category']
            ).first()

            if existing:
                skipped_count += 1
                continue

            # Create new training example
            training_example = TrainingExample(
                message=ex_data['message'],
                original_category=ex_data.get('original_category'),
                corrected_category=ex_data['corrected_category'],
                contributor_type=ex_data.get('contributor_type', 'unknown'),
                correction_timestamp=datetime.fromisoformat(ex_data['correction_timestamp']) if ex_data.get('correction_timestamp') else datetime.utcnow(),
                confidence_score=ex_data.get('confidence_score'),
                used_in_training=False
            )

            db.session.add(training_example)
            imported_count += 1

        db.session.commit()

        return jsonify({
            'success': True,
            'imported': imported_count,
            'skipped': skipped_count,
            'total_in_file': len(examples_data)
        })

    except Exception as e:
        db.session.rollback()
        return jsonify({'success': False, 'error': str(e)}), 500


@bp.route('/api/clear-training-examples', methods=['POST'])
@admin_required
def clear_training_examples():
    """Clear all training examples (with options)"""
    try:
        data = request.get_json() or {}

        # Options
        clear_unused_only = data.get('unused_only', False)
        sentence_level_only = data.get('sentence_level_only', False)

        # Build query
        query = TrainingExample.query

        if clear_unused_only:
            query = query.filter_by(used_in_training=False)

        if sentence_level_only:
            query = query.filter(TrainingExample.sentence_id != None)

        # Count before delete
        count = query.count()

        # Delete
        query.delete()
        db.session.commit()

        return jsonify({
            'success': True,
            'deleted': count,
            'unused_only': clear_unused_only,
            'sentence_level_only': sentence_level_only
        })

    except Exception as e:
        db.session.rollback()
        return jsonify({'success': False, 'error': str(e)}), 500


@bp.route('/import-training-dataset', methods=['POST'])
@admin_required
def import_training_dataset():
    """Import standalone training dataset (just training examples, not full session)"""
    if 'file' not in request.files:
        return jsonify({'success': False, 'error': 'No file uploaded'}), 400

    file = request.files['file']

    if file.filename == '':
        return jsonify({'success': False, 'error': 'No file selected'}), 400

    try:
        data = json.load(file)

        # Support both formats: array of examples or object with 'trainingExamples' key
        training_data = data if isinstance(data, list) else data.get('trainingExamples', [])

        imported_count = 0

        for ex_data in training_data:
            # Check if training example already exists (by message)
            existing = TrainingExample.query.filter_by(message=ex_data['message']).first()

            if existing:
                # Update existing example
                existing.original_category = ex_data.get('original_category')
                existing.corrected_category = ex_data['corrected_category']
                existing.contributor_type = ex_data.get('contributor_type', 'other')
                existing.correction_timestamp = datetime.utcnow()
                existing.confidence_score = ex_data.get('confidence_score')
            else:
                # Create placeholder submission if needed
                submission = Submission.query.filter_by(message=ex_data['message']).first()

                if not submission:
                    # Create placeholder submission for this training example
                    submission = Submission(
                        message=ex_data['message'],
                        contributor_type=ex_data.get('contributor_type', 'other'),
                        category=ex_data.get('corrected_category'),
                        timestamp=datetime.utcnow()
                    )
                    db.session.add(submission)
                    db.session.flush()  # Get submission ID

                # Create new training example
                training_example = TrainingExample(
                    submission_id=submission.id,
                    message=ex_data['message'],
                    original_category=ex_data.get('original_category'),
                    corrected_category=ex_data['corrected_category'],
                    contributor_type=ex_data.get('contributor_type', 'other'),
                    confidence_score=ex_data.get('confidence_score')
                )
                db.session.add(training_example)

            imported_count += 1

        db.session.commit()

        return jsonify({
            'success': True,
            'imported_count': imported_count
        })

    except KeyError as e:
        db.session.rollback()
        return jsonify({'success': False, 'error': f'Missing required field: {str(e)}'}), 400
    except Exception as e:
        db.session.rollback()
        return jsonify({'success': False, 'error': str(e)}), 500


# ============================================================================
# FINE-TUNING TRAINING ORCHESTRATION ENDPOINTS
# ============================================================================

@bp.route('/api/start-fine-tuning', methods=['POST'])
@admin_required
def start_fine_tuning():
    """Start a fine-tuning training run"""
    try:
        config = request.json

        # Validate minimum training examples
        min_examples = int(Settings.get_setting('min_training_examples', '20'))
        total_examples = TrainingExample.query.count()

        if total_examples < min_examples:
            return jsonify({
                'success': False,
                'error': f'Need at least {min_examples} training examples (have {total_examples})'
            }), 400

        # Create new training run record
        training_run = FineTuningRun(
            status='preparing'
        )
        training_run.set_config(config)
        db.session.add(training_run)
        db.session.commit()

        run_id = training_run.id

        # Start training in background thread
        import threading
        thread = threading.Thread(
            target=_run_training_job,
            args=(run_id, config)
        )
        thread.daemon = True
        thread.start()

        return jsonify({
            'success': True,
            'run_id': run_id,
            'message': 'Training started'
        })

    except Exception as e:
        db.session.rollback()
        return jsonify({'success': False, 'error': str(e)}), 500


def _run_training_job(run_id: int, config: Dict):
    """Background job for training (runs in separate thread)"""
    from app import create_app
    from app.fine_tuning import BARTFineTuner

    # Create new app context for this thread
    app = create_app()

    with app.app_context():
        try:
            # Get training run
            run = FineTuningRun.query.get(run_id)
            if not run:
                print(f"Training run {run_id} not found")
                return

            # Update status
            run.status = 'preparing'
            db.session.commit()

            # Get training examples (prefer sentence-level if available)
            use_sentence_level = config.get('use_sentence_level_training', True)

            if use_sentence_level:
                # Use only sentence-level training examples
                examples = TrainingExample.query.filter(TrainingExample.sentence_id != None).all()

                # Fallback to submission-level if not enough sentence-level examples
                if len(examples) < int(Settings.get_setting('min_training_examples', '20')):
                    logger.warning(f"Only {len(examples)} sentence-level examples found, including submission-level examples")
                    examples = TrainingExample.query.all()
            else:
                # Use all training examples (old behavior)
                examples = TrainingExample.query.all()

            training_data = [ex.to_dict() for ex in examples]

            logger.info(f"Using {len(training_data)} training examples ({len([e for e in examples if e.sentence_id])} sentence-level)")

            # Calculate split sizes
            total = len(training_data)
            run.num_training_examples = int(total * config.get('train_split', 0.7))
            run.num_validation_examples = int(total * config.get('val_split', 0.15))
            run.num_test_examples = total - run.num_training_examples - run.num_validation_examples
            db.session.commit()

            # Initialize trainer
            trainer = BARTFineTuner()

            # Prepare datasets
            train_dataset, val_dataset, test_dataset = trainer.prepare_dataset(
                training_data,
                train_split=config.get('train_split', 0.7),
                val_split=config.get('val_split', 0.15),
                test_split=config.get('test_split', 0.15)
            )

            # Setup model based on training mode
            training_mode = config.get('training_mode', 'head_only')

            if training_mode == 'head_only':
                # Head-only training (recommended for small datasets)
                trainer.setup_head_only_model()
            else:
                # LoRA training
                lora_config = {
                    'r': config.get('lora_rank', 16),
                    'lora_alpha': config.get('lora_alpha', 32),
                    'lora_dropout': config.get('lora_dropout', 0.1)
                }
                trainer.setup_lora_model(lora_config)

            # Update status to training
            run.status = 'training'
            db.session.commit()

            # Train
            models_dir = os.getenv('MODELS_DIR', '/data/models/finetuned')
            output_dir = os.path.join(models_dir, f'run_{run_id}')

            training_config = {
                'learning_rate': config.get('learning_rate', 3e-4),
                'num_epochs': config.get('num_epochs', 3),
                'batch_size': config.get('batch_size', 8)
            }

            train_metrics = trainer.train(
                train_dataset,
                val_dataset,
                output_dir,
                training_config,
                run_id=run_id
            )

            # Update status to evaluating
            run.status = 'evaluating'
            run.model_path = output_dir
            db.session.commit()

            # Evaluate on test set
            test_metrics = trainer.evaluate(test_dataset, output_dir)

            # Combine metrics
            results = {
                **train_metrics,
                **test_metrics
            }
            run.set_results(results)

            # Calculate improvement over baseline (simplified - just use test accuracy)
            baseline_accuracy = 0.60  # Placeholder - could run actual baseline comparison
            run.improvement_over_baseline = results['test_accuracy'] - baseline_accuracy

            # Mark training examples as used
            for example in examples:
                example.used_in_training = True
                example.training_run_id = run_id

            # Complete
            run.status = 'completed'
            run.completed_at = datetime.utcnow()
            db.session.commit()

            print(f"Training run {run_id} completed successfully")

        except Exception as e:
            print(f"Training run {run_id} failed: {str(e)}")
            run = FineTuningRun.query.get(run_id)
            if run:
                run.status = 'failed'
                run.error_message = str(e)
                db.session.commit()


@bp.route('/api/training-status/<int:run_id>', methods=['GET'])
@admin_required
def get_training_status(run_id):
    """Get status of a training run"""
    run = FineTuningRun.query.get_or_404(run_id)

    # Calculate progress percentage
    progress = 0
    if run.status == 'preparing':
        progress = 10
    elif run.status == 'training':
        # Calculate precise progress based on steps
        if run.total_steps and run.total_steps > 0 and run.current_step:
            step_progress = (run.current_step / run.total_steps) * 80  # 10-90% range for training
            progress = 10 + step_progress
        else:
            progress = 50  # Default fallback
    elif run.status == 'evaluating':
        progress = 90
    elif run.status == 'completed':
        progress = 100
    elif run.status == 'failed':
        progress = 0

    # Get training mode from config
    config = run.get_config() if hasattr(run, 'get_config') else {}
    training_mode = config.get('training_mode', 'lora')
    mode_label = 'classification head only' if training_mode == 'head_only' else 'LoRA adapters'
    use_sentence_level = config.get('use_sentence_level_training', True)

    status_messages = {
        'preparing': 'Preparing training data...',
        'training': f'Training model ({mode_label})...',
        'evaluating': 'Evaluating model performance...',
        'completed': 'Training completed successfully!',
        'failed': 'Training failed'
    }

    response = {
        'run_id': run_id,
        'status': run.status,
        'status_message': status_messages.get(run.status, run.status),
        'progress': progress,
        'details': '',
        'current_epoch': run.current_epoch if hasattr(run, 'current_epoch') else None,
        'total_epochs': run.total_epochs if hasattr(run, 'total_epochs') else None,
        'current_step': run.current_step if hasattr(run, 'current_step') else None,
        'total_steps': run.total_steps if hasattr(run, 'total_steps') else None,
        'current_loss': run.current_loss if hasattr(run, 'current_loss') else None,
        'progress_message': run.progress_message if hasattr(run, 'progress_message') else None
    }

    if run.status == 'training':
        if hasattr(run, 'progress_message') and run.progress_message:
            response['details'] = run.progress_message
        else:
            data_type = 'sentence-level' if use_sentence_level else 'submission-level'
            response['details'] = f'Training on {run.num_training_examples} {data_type} examples...'
    elif run.status == 'completed':
        results = run.get_results()
        if results:
            response['results'] = results
            response['details'] = f"Test accuracy: {results.get('test_accuracy', 0)*100:.1f}%"
    elif run.status == 'failed':
        response['error_message'] = run.error_message

    return jsonify(response)


@bp.route('/api/deploy-model/<int:run_id>', methods=['POST'])
@admin_required
def deploy_model(run_id):
    """Deploy a fine-tuned model"""
    try:
        from app.fine_tuning import ModelManager
        from app.analyzer import reload_analyzer

        manager = ModelManager()
        result = manager.deploy_model(run_id, db.session)

        # Reload analyzer to use new model
        reload_analyzer()

        return jsonify({
            'success': True,
            **result
        })

    except Exception as e:
        return jsonify({'success': False, 'error': str(e)}), 500


@bp.route('/api/rollback-model', methods=['POST'])
@admin_required
def rollback_model():
    """Rollback to base model"""
    try:
        from app.fine_tuning import ModelManager
        from app.analyzer import reload_analyzer

        manager = ModelManager()
        result = manager.rollback_to_baseline(db.session)

        # Reload analyzer to use base model
        reload_analyzer()

        return jsonify({
            'success': True,
            **result
        })

    except Exception as e:
        return jsonify({'success': False, 'error': str(e)}), 500


@bp.route('/api/run-details/<int:run_id>', methods=['GET'])
@admin_required
def get_run_details(run_id):
    """Get detailed information about a training run"""
    run = FineTuningRun.query.get_or_404(run_id)

    return jsonify(run.to_dict())


@bp.route('/api/set-zero-shot-model', methods=['POST'])
@admin_required
def set_zero_shot_model():
    """Set the zero-shot model for classification"""
    try:
        from app.fine_tuning.model_presets import get_model_preset
        from app.analyzer import reload_analyzer
        
        data = request.get_json()
        model_key = data.get('model_key')
        
        if not model_key:
            return jsonify({'success': False, 'error': 'No model key provided'}), 400
        
        # Validate model exists and supports zero-shot
        model_preset = get_model_preset(model_key)
        if not model_preset.get('supports_zero_shot', False):
            return jsonify({
                'success': False,
                'error': 'Selected model does not support zero-shot classification'
            }), 400
        
        # Save setting
        Settings.set_setting('zero_shot_model', model_key)
        
        # Reload analyzer with new model
        reload_analyzer()
        
        logger.info(f"Zero-shot model changed to: {model_preset['name']}")
        
        return jsonify({
            'success': True,
            'message': f"Zero-shot model changed to {model_preset['name']}",
            'model_key': model_key,
            'model_name': model_preset['name']
        })
        
    except Exception as e:
        logger.error(f"Error changing zero-shot model: {str(e)}")
        return jsonify({'success': False, 'error': str(e)}), 500


@bp.route('/api/get-zero-shot-model', methods=['GET'])
@admin_required
def get_zero_shot_model():
    """Get the current zero-shot model"""
    try:
        from app.fine_tuning.model_presets import get_model_preset
        
        model_key = Settings.get_setting('zero_shot_model', 'bart-large-mnli')
        model_preset = get_model_preset(model_key)
        
        return jsonify({
            'success': True,
            'model_key': model_key,
            'model_name': model_preset['name'],
            'model_info': {
                'size': model_preset['size'],
                'speed': model_preset['speed'],
                'description': model_preset['description']
            }
        })
        
    except Exception as e:
        logger.error(f"Error getting zero-shot model: {str(e)}")
        return jsonify({'success': False, 'error': str(e)}), 500


@bp.route('/api/delete-training-run/<int:run_id>', methods=['DELETE'])
@admin_required
def delete_training_run(run_id):
    """Delete a training run and its associated files"""
    try:
        run = FineTuningRun.query.get_or_404(run_id)

        # Prevent deletion of active model
        if run.is_active_model:
            return jsonify({
                'success': False,
                'error': 'Cannot delete the active model. Please rollback or deploy another model first.'
            }), 400

        # Prevent deletion of currently training runs
        if run.status == 'training':
            return jsonify({
                'success': False,
                'error': 'Cannot delete a training run that is currently in progress.'
            }), 400

        # Delete model files if they exist
        import shutil
        if run.model_path and os.path.exists(run.model_path):
            try:
                shutil.rmtree(run.model_path)
                logger.info(f"Deleted model files at {run.model_path}")
            except Exception as e:
                logger.error(f"Error deleting model files: {str(e)}")
                # Continue with database deletion even if file deletion fails

        # Unlink training examples from this run (don't delete the examples themselves)
        for example in run.training_examples:
            example.training_run_id = None
            example.used_in_training = False

        # Delete the training run from database
        db.session.delete(run)
        db.session.commit()

        return jsonify({
            'success': True,
            'message': f'Training run #{run_id} deleted successfully'
        })

    except Exception as e:
        db.session.rollback()
        logger.error(f"Error deleting training run: {str(e)}")
        return jsonify({'success': False, 'error': str(e)}), 500


@bp.route('/api/force-delete-training-run/<int:run_id>', methods=['DELETE'])
@admin_required
def force_delete_training_run(run_id):
    """Force delete a training run, bypassing all safety checks"""
    try:
        run = FineTuningRun.query.get_or_404(run_id)

        # If this is the active model, deactivate it first
        if run.is_active_model:
            run.is_active_model = False
            logger.warning(f"Force deleting active model run #{run_id}")

        # Delete model files if they exist
        import shutil
        if run.model_path and os.path.exists(run.model_path):
            try:
                shutil.rmtree(run.model_path)
                logger.info(f"Deleted model files at {run.model_path}")
            except Exception as e:
                logger.error(f"Error deleting model files: {str(e)}")
                # Continue with database deletion even if file deletion fails

        # Unlink training examples from this run (don't delete the examples themselves)
        for example in run.training_examples:
            example.training_run_id = None
            example.used_in_training = False

        # Delete the training run from database
        db.session.delete(run)
        db.session.commit()

        return jsonify({
            'success': True,
            'message': f'Training run #{run_id} force deleted successfully'
        })

    except Exception as e:
        db.session.rollback()
        logger.error(f"Error force deleting training run: {str(e)}")
        return jsonify({'success': False, 'error': str(e)}), 500


@bp.route('/api/export-model/<int:run_id>', methods=['GET'])
@admin_required
def export_model(run_id):
    """Export a trained model as a downloadable ZIP file"""
    try:
        import tempfile
        import shutil
        from datetime import datetime
        
        run = FineTuningRun.query.get_or_404(run_id)
        
        if run.status != 'completed':
            return jsonify({
                'success': False,
                'error': 'Can only export completed training runs'
            }), 400
        
        if not run.model_path or not os.path.exists(run.model_path):
            return jsonify({
                'success': False,
                'error': 'Model files not found'
            }), 404
        
        # Create temporary directory for export
        temp_dir = tempfile.mkdtemp()
        try:
            export_name = f"model_run_{run_id}"
            export_path = os.path.join(temp_dir, export_name)
            
            # Copy model files
            shutil.copytree(run.model_path, export_path)
            
            # Create model card with metadata
            config = run.get_config()
            results = run.get_results()
            
            model_card = {
                'run_id': run_id,
                'export_date': datetime.utcnow().isoformat(),
                'created_at': run.created_at.isoformat() if run.created_at else None,
                'training_mode': config.get('training_mode', 'lora'),
                'base_model': 'facebook/bart-large-mnli',
                'model_type': 'BART fine-tuned for text classification',
                'task': 'Multi-class text classification',
                'categories': ['Vision', 'Problem', 'Objectives', 'Directives', 'Values', 'Actions'],
                'training_config': config,
                'results': results,
                'improvement_over_baseline': run.improvement_over_baseline,
                'num_training_examples': run.num_training_examples,
                'num_validation_examples': run.num_validation_examples,
                'num_test_examples': run.num_test_examples
            }
            
            with open(os.path.join(export_path, 'model_card.json'), 'w') as f:
                json.dump(model_card, f, indent=2)
            
            # Create README
            readme_content = f"""# Participatory Planning Model - Run {run_id}

## Model Information
- **Export Date**: {datetime.utcnow().strftime('%Y-%m-%d %H:%M UTC')}
- **Training Mode**: {config.get('training_mode', 'lora').upper()}
- **Base Model**: facebook/bart-large-mnli
- **Task**: Multi-class text classification

## Categories
1. Vision
2. Problem
3. Objectives
4. Directives
5. Values
6. Actions

## Training Configuration
- **Learning Rate**: {config.get('learning_rate', 'N/A')}
- **Epochs**: {config.get('num_epochs', 'N/A')}
- **Batch Size**: {config.get('batch_size', 'N/A')}
- **Training Examples**: {run.num_training_examples}
- **Validation Examples**: {run.num_validation_examples}
- **Test Examples**: {run.num_test_examples}

## Performance
- **Test Accuracy**: {results.get('test_accuracy', 0)*100:.1f}%
- **Improvement over Baseline**: {run.improvement_over_baseline*100:.1f}%

## Usage
To load this model:
```python
from transformers import AutoTokenizer, AutoModelForSequenceClassification

tokenizer = AutoTokenizer.from_pretrained("./model_run_{run_id}")
model = AutoModelForSequenceClassification.from_pretrained("./model_run_{run_id}")
```

See model_card.json for detailed metrics.
"""
            
            with open(os.path.join(export_path, 'README.md'), 'w') as f:
                f.write(readme_content)
            
            # Create ZIP file
            zip_path = os.path.join(temp_dir, f"model_run_{run_id}")
            shutil.make_archive(zip_path, 'zip', temp_dir, export_name)
            zip_file = f"{zip_path}.zip"
            
            # Read ZIP file into memory before cleaning up temp dir
            with open(zip_file, 'rb') as f:
                zip_data = io.BytesIO(f.read())
            
            # Clean up temp directory
            shutil.rmtree(temp_dir)
            
            # Send file from memory
            zip_data.seek(0)
            return send_file(
                zip_data,
                mimetype='application/zip',
                as_attachment=True,
                download_name=f'participatory_planner_model_run_{run_id}_{datetime.now().strftime("%Y%m%d")}.zip'
            )
        except Exception as e:
            # Clean up temp dir if error occurs
            if os.path.exists(temp_dir):
                shutil.rmtree(temp_dir)
            raise e
    
    except Exception as e:
        logger.error(f"Error exporting model: {str(e)}")
        return jsonify({'success': False, 'error': str(e)}), 500


@bp.route('/api/import-model', methods=['POST'])
@admin_required
def import_model():
    """Import a previously exported model from ZIP file"""
    try:
        import tempfile
        import zipfile
        import shutil
        
        if 'file' not in request.files:
            return jsonify({'success': False, 'error': 'No file uploaded'}), 400
        
        file = request.files['file']
        
        if file.filename == '':
            return jsonify({'success': False, 'error': 'No file selected'}), 400
        
        if not file.filename.endswith('.zip'):
            return jsonify({'success': False, 'error': 'File must be a ZIP archive'}), 400
        
        # Create temporary directory for extraction
        with tempfile.TemporaryDirectory() as temp_dir:
            # Save uploaded ZIP
            zip_path = os.path.join(temp_dir, 'upload.zip')
            file.save(zip_path)
            
            # Extract ZIP
            extract_dir = os.path.join(temp_dir, 'extracted')
            os.makedirs(extract_dir, exist_ok=True)
            
            with zipfile.ZipFile(zip_path, 'r') as zip_ref:
                zip_ref.extractall(extract_dir)
            
            # Find the model directory (should be model_run_X)
            contents = os.listdir(extract_dir)
            if len(contents) != 1:
                return jsonify({'success': False, 'error': 'Invalid model archive structure'}), 400
            
            model_dir = os.path.join(extract_dir, contents[0])
            
            # Validate it's a valid model
            required_files = ['config.json']
            model_files = ['pytorch_model.bin', 'model.safetensors']  # Either format
            
            has_config = os.path.exists(os.path.join(model_dir, 'config.json'))
            has_model = any(os.path.exists(os.path.join(model_dir, f)) for f in model_files)
            
            if not has_config or not has_model:
                return jsonify({
                    'success': False,
                    'error': 'Invalid model archive - missing required files (config.json and model weights)'
                }), 400
            
            # Read model card if available
            model_info = {}
            model_card_path = os.path.join(model_dir, 'model_card.json')
            if os.path.exists(model_card_path):
                with open(model_card_path, 'r') as f:
                    model_info = json.load(f)
            
            # Create new training run record
            training_run = FineTuningRun(
                status='completed',
                created_at=datetime.utcnow()
            )
            
            # Set config from model card if available
            if 'training_config' in model_info:
                training_run.set_config(model_info['training_config'])
            else:
                # Default config for imported models
                training_run.set_config({
                    'training_mode': 'imported',
                    'imported': True,
                    'original_filename': file.filename
                })
            
            # Set metadata from model card
            if 'num_training_examples' in model_info:
                training_run.num_training_examples = model_info['num_training_examples']
            if 'num_validation_examples' in model_info:
                training_run.num_validation_examples = model_info['num_validation_examples']
            if 'num_test_examples' in model_info:
                training_run.num_test_examples = model_info['num_test_examples']
            if 'results' in model_info:
                training_run.set_results(model_info['results'])
            if 'improvement_over_baseline' in model_info:
                training_run.improvement_over_baseline = model_info['improvement_over_baseline']
            
            training_run.completed_at = datetime.utcnow()
            
            db.session.add(training_run)
            db.session.commit()
            
            # Copy model to models directory
            models_dir = os.getenv('MODELS_DIR', '/data/models/finetuned')
            destination_path = os.path.join(models_dir, f'run_{training_run.id}')
            
            shutil.copytree(model_dir, destination_path)
            training_run.model_path = destination_path
            db.session.commit()
            
            logger.info(f"Model imported successfully as run {training_run.id}")
            
            return jsonify({
                'success': True,
                'run_id': training_run.id,
                'message': f'Model imported successfully as run #{training_run.id}',
                'model_info': model_info
            })
    
    except zipfile.BadZipFile:
        return jsonify({'success': False, 'error': 'Invalid ZIP file'}), 400
    except Exception as e:
        db.session.rollback()
        logger.error(f"Error importing model: {str(e)}")
        return jsonify({'success': False, 'error': str(e)}), 500