NDOJ/judge/migrations/0118_rating.py

import math
from operator import attrgetter, itemgetter

from django.db import migrations, models
from django.db.models import Count, OuterRef, Subquery
from django.db.models.functions import Coalesce
from django.utils import timezone


def tie_ranker(iterable, key=attrgetter("points")):
    rank = 0
    delta = 1
    last = None
    buf = []
    for item in iterable:
        new = key(item)
        if new != last:
            for _ in buf:
                yield rank + (delta - 1) / 2.0
            rank += delta
            delta = 0
            buf = []
        delta += 1
        buf.append(item)
        last = key(item)
    for _ in buf:
        yield rank + (delta - 1) / 2.0


def rational_approximation(t):
    # Abramowitz and Stegun formula 26.2.23.
    # The absolute value of the error should be less than 4.5 e-4.
    c = [2.515517, 0.802853, 0.010328]
    d = [1.432788, 0.189269, 0.001308]
    numerator = (c[2] * t + c[1]) * t + c[0]
    denominator = ((d[2] * t + d[1]) * t + d[0]) * t + 1.0
    return t - numerator / denominator


def normal_CDF_inverse(p):
    assert 0.0 < p < 1

    # See article above for explanation of this section.
    if p < 0.5:
        # F^-1(p) = - G^-1(p)
        return -rational_approximation(math.sqrt(-2.0 * math.log(p)))
    else:
        # F^-1(p) = G^-1(1-p)
        return rational_approximation(math.sqrt(-2.0 * math.log(1.0 - p)))


def WP(RA, RB, VA, VB):
    return (math.erf((RB - RA) / math.sqrt(2 * (VA * VA + VB * VB))) + 1) / 2.0


def recalculate_ratings(
    old_rating, old_volatility, actual_rank, times_rated, is_disqualified
):
    # actual_rank: 1 is first place, N is last place
    # if there are ties, use the average of places (if places 2, 3, 4, 5 tie, use 3.5 for all of them)

    N = len(old_rating)
    new_rating = old_rating[:]
    new_volatility = old_volatility[:]
    if N <= 1:
        return new_rating, new_volatility

    ranking = list(range(N))
    ranking.sort(key=old_rating.__getitem__, reverse=True)

    ave_rating = float(sum(old_rating)) / N
    sum1 = sum(i * i for i in old_volatility) / N
    sum2 = sum((i - ave_rating) ** 2 for i in old_rating) / (N - 1)
    CF = math.sqrt(sum1 + sum2)

    for i in range(N):
        ERank = 0.5
        for j in range(N):
            ERank += WP(
                old_rating[i], old_rating[j], old_volatility[i], old_volatility[j]
            )

        EPerf = -normal_CDF_inverse((ERank - 0.5) / N)
        APerf = -normal_CDF_inverse((actual_rank[i] - 0.5) / N)
        PerfAs = old_rating[i] + CF * (APerf - EPerf)
        Weight = 1.0 / (1 - (0.42 / (times_rated[i] + 1) + 0.18)) - 1.0
        if old_rating[i] > 2500:
            Weight *= 0.8
        elif old_rating[i] >= 2000:
            Weight *= 0.9

        Cap = 150.0 + 1500.0 / (times_rated[i] + 2)

        new_rating[i] = (old_rating[i] + Weight * PerfAs) / (1.0 + Weight)

        if abs(old_rating[i] - new_rating[i]) > Cap:
            if old_rating[i] < new_rating[i]:
                new_rating[i] = old_rating[i] + Cap
            else:
                new_rating[i] = old_rating[i] - Cap

        if times_rated[i] == 0:
            new_volatility[i] = 385
        else:
            new_volatility[i] = math.sqrt(
                ((new_rating[i] - old_rating[i]) ** 2) / Weight
                + (old_volatility[i] ** 2) / (Weight + 1)
            )

        if is_disqualified[i]:
            # DQed users can manipulate TopCoder ratings to get higher volatility in order to increase their rating
            # later on, prohibit this by ensuring their volatility never increases in this situation
            new_volatility[i] = min(new_volatility[i], old_volatility[i])

    # try to keep the sum of ratings constant
    adjust = float(sum(old_rating) - sum(new_rating)) / N
    new_rating = list(map(adjust.__add__, new_rating))
    # inflate a little if we have to so people who placed first don't lose rating
    best_rank = min(actual_rank)
    for i in range(N):
        if (
            abs(actual_rank[i] - best_rank) <= 1e-3
            and new_rating[i] < old_rating[i] + 1
        ):
            new_rating[i] = old_rating[i] + 1
    return list(map(int, map(round, new_rating))), list(
        map(int, map(round, new_volatility))
    )


def tc_rate_contest(contest, Rating, Profile):
    rating_subquery = Rating.objects.filter(user=OuterRef("user"))
    rating_sorted = rating_subquery.order_by("-contest__end_time")
    users = (
        contest.users.order_by("is_disqualified", "-score", "cumtime", "tiebreaker")
        .annotate(
            submissions=Count("submission"),
            last_rating=Coalesce(Subquery(rating_sorted.values("rating")[:1]), 1200),
            volatility=Coalesce(Subquery(rating_sorted.values("volatility")[:1]), 535),
            times=Coalesce(
                Subquery(
                    rating_subquery.order_by()
                    .values("user_id")
                    .annotate(count=Count("id"))
                    .values("count")
                ),
                0,
            ),
        )
        .exclude(user_id__in=contest.rate_exclude.all())
        .filter(virtual=0)
        .values(
            "id",
            "user_id",
            "score",
            "cumtime",
            "tiebreaker",
            "is_disqualified",
            "last_rating",
            "volatility",
            "times",
        )
    )
    if not contest.rate_all:
        users = users.filter(submissions__gt=0)
    if contest.rating_floor is not None:
        users = users.exclude(last_rating__lt=contest.rating_floor)
    if contest.rating_ceiling is not None:
        users = users.exclude(last_rating__gt=contest.rating_ceiling)

    users = list(users)
    participation_ids = list(map(itemgetter("id"), users))
    user_ids = list(map(itemgetter("user_id"), users))
    is_disqualified = list(map(itemgetter("is_disqualified"), users))
    ranking = list(tie_ranker(users, key=itemgetter("score", "cumtime", "tiebreaker")))
    old_rating = list(map(itemgetter("last_rating"), users))
    old_volatility = list(map(itemgetter("volatility"), users))
    times_ranked = list(map(itemgetter("times"), users))
    rating, volatility = recalculate_ratings(
        old_rating, old_volatility, ranking, times_ranked, is_disqualified
    )

    now = timezone.now()
    ratings = [
        Rating(
            user_id=i,
            contest=contest,
            rating=r,
            volatility=v,
            last_rated=now,
            participation_id=p,
            rank=z,
        )
        for i, p, r, v, z in zip(
            user_ids, participation_ids, rating, volatility, ranking
        )
    ]

    Rating.objects.bulk_create(ratings)

    Profile.objects.filter(
        contest_history__contest=contest, contest_history__virtual=0
    ).update(
        rating=Subquery(
            Rating.objects.filter(user=OuterRef("id"))
            .order_by("-contest__end_time")
            .values("rating")[:1]
        )
    )


# inspired by rate_all_view
def rate_tc(apps, schema_editor):
    Contest = apps.get_model("judge", "Contest")
    Rating = apps.get_model("judge", "Rating")
    Profile = apps.get_model("judge", "Profile")

    with schema_editor.connection.cursor() as cursor:
        cursor.execute("TRUNCATE TABLE `%s`" % Rating._meta.db_table)
    Profile.objects.update(rating=None)
    for contest in Contest.objects.filter(
        is_rated=True, end_time__lte=timezone.now()
    ).order_by("end_time"):
        tc_rate_contest(contest, Rating, Profile)


# inspired by rate_all_view
def rate_elo_mmr(apps, schema_editor):
    Rating = apps.get_model("judge", "Rating")
    Profile = apps.get_model("judge", "Profile")

    with schema_editor.connection.cursor() as cursor:
        cursor.execute("TRUNCATE TABLE `%s`" % Rating._meta.db_table)
    Profile.objects.update(rating=None)
    # Don't populate Rating


class Migration(migrations.Migration):

    dependencies = [
        ("judge", "0117_auto_20211209_0612"),
    ]

    operations = [
        migrations.RunPython(migrations.RunPython.noop, rate_tc, atomic=True),
        migrations.AddField(
            model_name="rating",
            name="mean",
            field=models.FloatField(verbose_name="raw rating"),
        ),
        migrations.AddField(
            model_name="rating",
            name="performance",
            field=models.FloatField(verbose_name="contest performance"),
        ),
        migrations.RemoveField(
            model_name="rating",
            name="volatility",
            field=models.IntegerField(verbose_name="volatility"),
        ),
        migrations.RunPython(rate_elo_mmr, migrations.RunPython.noop, atomic=True),
    ]
Change rating system (DMOJ) 2021-12-09 05:52:52 +00:00			`import math`
			`from operator import attrgetter, itemgetter`

			`from django.db import migrations, models`
			`from django.db.models import Count, OuterRef, Subquery`
			`from django.db.models.functions import Coalesce`
			`from django.utils import timezone`


Reformat using black 2022-05-14 17:57:27 +00:00			`def tie_ranker(iterable, key=attrgetter("points")):`
Change rating system (DMOJ) 2021-12-09 05:52:52 +00:00			`rank = 0`
			`delta = 1`
			`last = None`
			`buf = []`
			`for item in iterable:`
			`new = key(item)`
			`if new != last:`
			`for _ in buf:`
			`yield rank + (delta - 1) / 2.0`
			`rank += delta`
			`delta = 0`
			`buf = []`
			`delta += 1`
			`buf.append(item)`
			`last = key(item)`
			`for _ in buf:`
			`yield rank + (delta - 1) / 2.0`


			`def rational_approximation(t):`
			`# Abramowitz and Stegun formula 26.2.23.`
			`# The absolute value of the error should be less than 4.5 e-4.`
			`c = [2.515517, 0.802853, 0.010328]`
			`d = [1.432788, 0.189269, 0.001308]`
			`numerator = (c[2] * t + c[1]) * t + c[0]`
			`denominator = ((d[2] * t + d[1]) * t + d[0]) * t + 1.0`
			`return t - numerator / denominator`


			`def normal_CDF_inverse(p):`
			`assert 0.0 < p < 1`

			`# See article above for explanation of this section.`
			`if p < 0.5:`
			`# F^-1(p) = - G^-1(p)`
			`return -rational_approximation(math.sqrt(-2.0 * math.log(p)))`
			`else:`
			`# F^-1(p) = G^-1(1-p)`
			`return rational_approximation(math.sqrt(-2.0 * math.log(1.0 - p)))`


			`def WP(RA, RB, VA, VB):`
			`return (math.erf((RB - RA) / math.sqrt(2 * (VA * VA + VB * VB))) + 1) / 2.0`


Reformat using black 2022-05-14 17:57:27 +00:00			`def recalculate_ratings(`
			`old_rating, old_volatility, actual_rank, times_rated, is_disqualified`
			`):`
Change rating system (DMOJ) 2021-12-09 05:52:52 +00:00			`# actual_rank: 1 is first place, N is last place`
			`# if there are ties, use the average of places (if places 2, 3, 4, 5 tie, use 3.5 for all of them)`

			`N = len(old_rating)`
			`new_rating = old_rating[:]`
			`new_volatility = old_volatility[:]`
			`if N <= 1:`
			`return new_rating, new_volatility`

			`ranking = list(range(N))`
			`ranking.sort(key=old_rating.__getitem__, reverse=True)`

			`ave_rating = float(sum(old_rating)) / N`
			`sum1 = sum(i * i for i in old_volatility) / N`
			`sum2 = sum((i - ave_rating) ** 2 for i in old_rating) / (N - 1)`
			`CF = math.sqrt(sum1 + sum2)`

			`for i in range(N):`
			`ERank = 0.5`
			`for j in range(N):`
Reformat using black 2022-05-14 17:57:27 +00:00			`ERank += WP(`
			`old_rating[i], old_rating[j], old_volatility[i], old_volatility[j]`
			`)`
Change rating system (DMOJ) 2021-12-09 05:52:52 +00:00
			`EPerf = -normal_CDF_inverse((ERank - 0.5) / N)`
			`APerf = -normal_CDF_inverse((actual_rank[i] - 0.5) / N)`
			`PerfAs = old_rating[i] + CF * (APerf - EPerf)`
			`Weight = 1.0 / (1 - (0.42 / (times_rated[i] + 1) + 0.18)) - 1.0`
			`if old_rating[i] > 2500:`
			`Weight *= 0.8`
			`elif old_rating[i] >= 2000:`
			`Weight *= 0.9`

			`Cap = 150.0 + 1500.0 / (times_rated[i] + 2)`

			`new_rating[i] = (old_rating[i] + Weight * PerfAs) / (1.0 + Weight)`

			`if abs(old_rating[i] - new_rating[i]) > Cap:`
			`if old_rating[i] < new_rating[i]:`
			`new_rating[i] = old_rating[i] + Cap`
			`else:`
			`new_rating[i] = old_rating[i] - Cap`

			`if times_rated[i] == 0:`
			`new_volatility[i] = 385`
			`else:`
Reformat using black 2022-05-14 17:57:27 +00:00			`new_volatility[i] = math.sqrt(`
			`((new_rating[i] - old_rating[i]) ** 2) / Weight`
			`+ (old_volatility[i] ** 2) / (Weight + 1)`
			`)`
Change rating system (DMOJ) 2021-12-09 05:52:52 +00:00
			`if is_disqualified[i]:`
			`# DQed users can manipulate TopCoder ratings to get higher volatility in order to increase their rating`
			`# later on, prohibit this by ensuring their volatility never increases in this situation`
			`new_volatility[i] = min(new_volatility[i], old_volatility[i])`

			`# try to keep the sum of ratings constant`
			`adjust = float(sum(old_rating) - sum(new_rating)) / N`
			`new_rating = list(map(adjust.__add__, new_rating))`
			`# inflate a little if we have to so people who placed first don't lose rating`
			`best_rank = min(actual_rank)`
			`for i in range(N):`
Reformat using black 2022-05-14 17:57:27 +00:00			`if (`
			`abs(actual_rank[i] - best_rank) <= 1e-3`
			`and new_rating[i] < old_rating[i] + 1`
			`):`
Change rating system (DMOJ) 2021-12-09 05:52:52 +00:00			`new_rating[i] = old_rating[i] + 1`
Reformat using black 2022-05-14 17:57:27 +00:00			`return list(map(int, map(round, new_rating))), list(`
			`map(int, map(round, new_volatility))`
			`)`
Change rating system (DMOJ) 2021-12-09 05:52:52 +00:00

			`def tc_rate_contest(contest, Rating, Profile):`
Reformat using black 2022-05-14 17:57:27 +00:00			`rating_subquery = Rating.objects.filter(user=OuterRef("user"))`
			`rating_sorted = rating_subquery.order_by("-contest__end_time")`
			`users = (`
			`contest.users.order_by("is_disqualified", "-score", "cumtime", "tiebreaker")`
			`.annotate(`
			`submissions=Count("submission"),`
			`last_rating=Coalesce(Subquery(rating_sorted.values("rating")[:1]), 1200),`
			`volatility=Coalesce(Subquery(rating_sorted.values("volatility")[:1]), 535),`
			`times=Coalesce(`
			`Subquery(`
			`rating_subquery.order_by()`
			`.values("user_id")`
			`.annotate(count=Count("id"))`
			`.values("count")`
			`),`
			`0,`
			`),`
			`)`
			`.exclude(user_id__in=contest.rate_exclude.all())`
			`.filter(virtual=0)`
			`.values(`
			`"id",`
			`"user_id",`
			`"score",`
			`"cumtime",`
			`"tiebreaker",`
			`"is_disqualified",`
			`"last_rating",`
			`"volatility",`
			`"times",`
			`)`
			`)`
Change rating system (DMOJ) 2021-12-09 05:52:52 +00:00			`if not contest.rate_all:`
			`users = users.filter(submissions__gt=0)`
			`if contest.rating_floor is not None:`
			`users = users.exclude(last_rating__lt=contest.rating_floor)`
			`if contest.rating_ceiling is not None:`
			`users = users.exclude(last_rating__gt=contest.rating_ceiling)`

			`users = list(users)`
Reformat using black 2022-05-14 17:57:27 +00:00			`participation_ids = list(map(itemgetter("id"), users))`
			`user_ids = list(map(itemgetter("user_id"), users))`
			`is_disqualified = list(map(itemgetter("is_disqualified"), users))`
			`ranking = list(tie_ranker(users, key=itemgetter("score", "cumtime", "tiebreaker")))`
			`old_rating = list(map(itemgetter("last_rating"), users))`
			`old_volatility = list(map(itemgetter("volatility"), users))`
			`times_ranked = list(map(itemgetter("times"), users))`
			`rating, volatility = recalculate_ratings(`
			`old_rating, old_volatility, ranking, times_ranked, is_disqualified`
			`)`
Change rating system (DMOJ) 2021-12-09 05:52:52 +00:00
			`now = timezone.now()`
Reformat using black 2022-05-14 17:57:27 +00:00			`ratings = [`
			`Rating(`
			`user_id=i,`
			`contest=contest,`
			`rating=r,`
			`volatility=v,`
			`last_rated=now,`
			`participation_id=p,`
			`rank=z,`
			`)`
			`for i, p, r, v, z in zip(`
			`user_ids, participation_ids, rating, volatility, ranking`
			`)`
			`]`
Change rating system (DMOJ) 2021-12-09 05:52:52 +00:00
			`Rating.objects.bulk_create(ratings)`

Reformat using black 2022-05-14 17:57:27 +00:00			`Profile.objects.filter(`
			`contest_history__contest=contest, contest_history__virtual=0`
			`).update(`
			`rating=Subquery(`
			`Rating.objects.filter(user=OuterRef("id"))`
			`.order_by("-contest__end_time")`
			`.values("rating")[:1]`
			`)`
			`)`
Change rating system (DMOJ) 2021-12-09 05:52:52 +00:00

			`# inspired by rate_all_view`
			`def rate_tc(apps, schema_editor):`
Reformat using black 2022-05-14 17:57:27 +00:00			`Contest = apps.get_model("judge", "Contest")`
			`Rating = apps.get_model("judge", "Rating")`
			`Profile = apps.get_model("judge", "Profile")`
Change rating system (DMOJ) 2021-12-09 05:52:52 +00:00
			`with schema_editor.connection.cursor() as cursor:`
Reformat using black 2022-05-14 17:57:27 +00:00			cursor.execute("TRUNCATE TABLE `%s`" % Rating._meta.db_table)
Change rating system (DMOJ) 2021-12-09 05:52:52 +00:00			`Profile.objects.update(rating=None)`
Reformat using black 2022-05-14 17:57:27 +00:00			`for contest in Contest.objects.filter(`
			`is_rated=True, end_time__lte=timezone.now()`
			`).order_by("end_time"):`
Change rating system (DMOJ) 2021-12-09 05:52:52 +00:00			`tc_rate_contest(contest, Rating, Profile)`


			`# inspired by rate_all_view`
			`def rate_elo_mmr(apps, schema_editor):`
Reformat using black 2022-05-14 17:57:27 +00:00			`Rating = apps.get_model("judge", "Rating")`
			`Profile = apps.get_model("judge", "Profile")`
Change rating system (DMOJ) 2021-12-09 05:52:52 +00:00
			`with schema_editor.connection.cursor() as cursor:`
Reformat using black 2022-05-14 17:57:27 +00:00			cursor.execute("TRUNCATE TABLE `%s`" % Rating._meta.db_table)
Change rating system (DMOJ) 2021-12-09 05:52:52 +00:00			`Profile.objects.update(rating=None)`
			`# Don't populate Rating`


			`class Migration(migrations.Migration):`

			`dependencies = [`
Reformat using black 2022-05-14 17:57:27 +00:00			`("judge", "0117_auto_20211209_0612"),`
Change rating system (DMOJ) 2021-12-09 05:52:52 +00:00			`]`

			`operations = [`
			`migrations.RunPython(migrations.RunPython.noop, rate_tc, atomic=True),`
			`migrations.AddField(`
Reformat using black 2022-05-14 17:57:27 +00:00			`model_name="rating",`
			`name="mean",`
			`field=models.FloatField(verbose_name="raw rating"),`
Change rating system (DMOJ) 2021-12-09 05:52:52 +00:00			`),`
			`migrations.AddField(`
Reformat using black 2022-05-14 17:57:27 +00:00			`model_name="rating",`
			`name="performance",`
			`field=models.FloatField(verbose_name="contest performance"),`
Change rating system (DMOJ) 2021-12-09 05:52:52 +00:00			`),`
			`migrations.RemoveField(`
Reformat using black 2022-05-14 17:57:27 +00:00			`model_name="rating",`
			`name="volatility",`
			`field=models.IntegerField(verbose_name="volatility"),`
Change rating system (DMOJ) 2021-12-09 05:52:52 +00:00			`),`
			`migrations.RunPython(rate_elo_mmr, migrations.RunPython.noop, atomic=True),`
Reformat using black 2022-05-14 17:57:27 +00:00			`]`