In [51]:
import pymysql
import os
import re
import pywikibot
import requests
In [52]:
site = pywikibot.Site('zh', 'wikipedia')
site.login()
In [53]:
host = os.environ['MYSQL_HOST']
user = os.environ['MYSQL_USERNAME']
password = os.environ['MYSQL_PASSWORD']
In [54]:
conn = pymysql.connect(
    host=host,
    user=user,
    password=password,
    charset="utf8"
)
In [55]:
# https://quarry.wmflabs.org/query/31893
with conn.cursor() as cur:
    cur.execute('use zhwiki_p')
    cur.execute("""
        SELECT log_timestamp, log_title, comment_text
        FROM logging
        LEFT JOIN comment ON log_comment_id = comment_id
        WHERE log_type = "delete"
            AND log_action = "delete"
            AND comment_text LIKE "%G13%"
            AND log_timestamp > '201912010000' AND log_timestamp < '20200330235959'
        ORDER BY log_timestamp DESC
    """)
    res = cur.fetchall()
In [56]:
is_cx = 0
not_cx = 0
no_logs = 0
total = 0
In [57]:
for row in res:
    log_timestamp = row[0].decode()
    log_title = row[1].decode()
    comment_text = row[2].decode()
    
    data = {
        "action": "query",
        "format": "json",
        "list": "logevents",
        "leprop": "tags",
        "leaction": "create/create",
        "lestart": log_timestamp,
        "letitle": log_title,
        "lelimit": "1"
    }
    res = requests.get('https://zh.wikipedia.org/w/api.php', params=data).json()
    if len(res['query']['logevents']) > 0:
        tags = res['query']['logevents'][0]['tags']
        print(log_title, tags)
        if 'contenttranslation' in tags:
            is_cx += 1
        else:
            not_cx += 1
    else:
        print(log_title, 'no logs')
        no_logs += 1
    total += 1
喬治亞州立體育館 []
楊原君 []
世界听力日 ['contenttranslation', 'file', 'contenttranslation-v2']
City_pop ['博客链接', 'IMPARTIAL', 'missing-template']
若松幸禧 []
Coleophora_dextrella ['contenttranslation', 'contenttranslation-v2']
牛庄之战 ['mobile edit', 'mobile web edit', 'wikify']
国道77号_(韩国) []
日本索尼影視娛樂 ['contenttranslation', 'file', 'contenttranslation-v2']
視野定義語言 []
放射治療師 []
放射劑量師 ['unicode other']
欣策尔假设H ['contenttranslation', 'contenttranslation-v2']
乃木坂46_7th_YEAR_BIRTHDAY_LIVE_2019.2.21-24_KYOCERA_DOME_OSAKA ['contenttranslation', 'contenttranslation-v2']
已知的最大質數 no logs
可能質數 ['contenttranslation', 'contenttranslation-v2']
软软猫咪 ['contenttranslation', '新用户加入明显宣传性内容', 'contenttranslation-v2']
国会广播 ['mobile edit', 'mobile web edit']
6P1P ['contenttranslation', 'file', 'contenttranslation-v2']
A_Sharp_(.NET) ['visualeditor']
潘登智 ['unicode other', 'unicode pua', 'IMPARTIAL']
Ubercode ['visualeditor-wikitext']
A_Sharp_(Axiom) ['visualeditor-wikitext']
SHOT ['mobile edit', 'mobile web edit', 'visualeditor']
雷內.莫里斯.蓋特福斯 ['contenttranslation', 'contenttranslation-v2']
16条人格特征 ['mobile edit', 'mobile web edit', 'wikify']
強.發勒內_Jean._Valnet ['contenttranslation', 'contenttranslation-v2']
行为蔓延 ['contenttranslation', 'contenttranslation-v2']
澳門居民往來香港特別行政區旅遊證 ['mobile edit', 'mobile web edit']
Marek_Kamiński_-_的探險家 ['file', '新用户加入明显宣传性内容', 'IMPARTIAL', 'missing-template']
布拉諾 ['mobile edit', 'mobile web edit']
歐洲氣旋 ['mobile edit', 'mobile web edit', 'wikify']
罗斯步枪 ['contenttranslation', 'file', '博客链接', 'contenttranslation-v2']
苏里南国家元首名单 ['mobile edit', 'mobile web edit', 'visualeditor']
德黑兰-库姆-伊斯法罕高铁 ['contenttranslation', 'unicode other', 'contenttranslation-v2', 'missing-template']
赫爾結婚定理 ['mw-new-redirect']
赫尔婚姻定理 ['visualeditor']
秩多项式 ['visualeditor']
塔特–柏格公式 ['visualeditor']
Yangian no logs
反加泰罗尼亚主义 ['contenttranslation', 'file', 'contenttranslation-v2']
SAGE_IV ['visualeditor']
Phạm_Đăng_Trí ['contenttranslation', 'contenttranslation-v2', 'IMPARTIAL']
安靜時間 ['mobile edit', 'mobile web edit', 'advanced mobile edit']
DB_ProjektBau no logs
体育书 ['visualeditor']
漫畫人生STORIA ['visualeditor']
奧赫里安帕斯卡 ['visualeditor', 'IMPARTIAL']
奧赫里安●帕斯卡 ['visualeditor', '加入魔術字', 'IMPARTIAL']
Carles_Puigdemont_i_Casamajó ['wikify', 'IMPARTIAL']
国会广播 ['mobile edit', 'mobile web edit']
国会广播 ['mobile edit', 'mobile web edit']
View_(1940年) ['IMPARTIAL']
W.G.Bagnall ['新用户加入明显宣传性内容', 'wikify']
辛辛那提辣椒 ['wikify']
和平广播 ['mobile edit', 'mobile web edit']
伊万·巴卡诺夫 ['contenttranslation', 'contenttranslation-v2']
国会广播 ['visualeditor']
NATV_国会广播 ['mw-new-redirect', 'visualeditor']
龙普碧纳 ['contenttranslation', '非可靠来源', 'contenttranslation-v2']
因地那韋 []
阿里·馬哈茂德·蘇萊曼 ['contenttranslation', 'contenttranslation-v2']
MBC深夜劇集 ['contenttranslation', 'contenttranslation-v2']
电动独轮车 ['contenttranslation', 'contenttranslation-v2']
國立健保集團_(新加坡) []
AviaAM_Leasing ['contenttranslation', '新用户加入明显宣传性内容', 'contenttranslation-v2']
奥维互动地图 ['visualeditor', '小小作品']
马尔科姆·大卫·凯利 ['mobile edit', 'mobile web edit']
肯·梁 ['mobile edit', 'mobile web edit', 'visualeditor']
纳威恩·安德利维斯 ['mobile edit', 'mobile web edit']
杰瑞米·戴维斯 ['mobile edit', 'mobile web edit']
伊丽莎白·米切尔 ['mobile edit', 'mobile web edit', 'visualeditor']
乔治·加西亚 ['mobile edit', 'mobile web edit', 'wikify']
我身體裡的那個傢伙 ['wikify']
佛教TV ['mobile edit', 'mobile web edit', 'missing-template']
尤金·帕爾默 ['unicode other']
吉奧吉歐·阿爾比基 no logs
依恋障碍 ['contenttranslation', 'contenttranslation-v2']
Josef_H._Neumann ['contenttranslation', 'file', '新用户加入明显宣传性内容', 'unicode other', 'contenttranslation-v2']
十里广场车厂 ['contenttranslation', 'contenttranslation-v2']
佛教广播 no logs
國會廣播 ['visualeditor', 'missing-template']
迪迪埃·馬特里格 no logs
Kola_nut_可乐果 ['contenttranslation', 'file', 'contenttranslation-v2']
殲滅13區 ['mobile edit', 'mobile web edit', 'visualeditor']
驚爆點 ['mobile edit', 'mobile web edit', '小小作品']
Thomas_The_Tank_Engine ['mobile edit', 'mobile web edit', '新用户加入明显宣传性内容', 'wikify', 'IMPARTIAL']
莫尼鲁尔伊斯兰 []
环保世界化 ['wikify']
吉爾吉斯經濟大學 ['contenttranslation', 'contenttranslation-v2']
沈琳宸 ['mobile edit', 'mobile web edit', 'visualeditor']
刘谦益 ['mobile edit', 'mobile web edit', 'visualeditor']
西沃核电站 []
德國電影獎最佳影片獎 no logs
印度電影觀眾獎得獎電影列表 no logs
胃病疾病 ['mobile edit', 'mobile web edit', 'advanced mobile edit']
急性红系白血病 ['mobile edit', 'mobile web edit']
佛教TV ['visualeditor', 'missing-template']
藍色門 ['mobile edit', 'mobile web edit', 'advanced mobile edit']
2019年德里工廠火災 ['contenttranslation', 'contenttranslation-v2']
Neo4j ['contenttranslation', '博客链接', 'contenttranslation-v2']
銀牙傳說WEED ['missing-template']
次优二叉树 []
假新聞網頁 ['contenttranslation', 'contenttranslation-v2']
普利亚谱·所沃特 ['visualeditor', 'IMPARTIAL']
內華達州國道396號 no logs
In [58]:
print(is_cx, not_cx, no_logs, total)
29 68 9 106