{
 "cells": [
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "# Tables"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 1,
   "metadata": {},
   "outputs": [],
   "source": [
    "import pandas as pd\n",
    "import os"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 4,
   "metadata": {},
   "outputs": [],
   "source": [
    "path2SP = \"/Users/ctoruno/OneDrive - World Justice Project/EU Subnational/EU-S Data/Automated Qualitative Checks/Data\"\n",
    "\n",
    "eu_member_states = [\n",
    "    \"Austria\",\"Belgium\",\"Bulgaria\",\"Croatia\",\"Cyprus\",\"Czechia\",\"Denmark\",\"Estonia\",\n",
    "    \"Finland\",\"France\",\"Germany\",\"Greece\",\"Hungary\",\"Ireland\",\"Italy\",\"Latvia\",\n",
    "    \"Lithuania\",\"Luxembourg\",\"Malta\",\"Netherlands\",\"Poland\",\"Portugal\",\"Romania\",\"Slovakia\",\n",
    "    \"Slovenia\",\"Spain\",\"Sweden\"\n",
    "]\n"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### Table 1: Extracted Data"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 3,
   "metadata": {},
   "outputs": [],
   "source": [
    "data_tbl01 = {\n",
    "    \"Country\": [\"Austria\", \"Belgium\", \"Bulgaria\", \"Croatia\", \"Cyprus\", \"Czechia\", \"Denmark\", \"Estonia\", \"Finland\", \"France\", \n",
    "                \"Germany\", \"Greece\", \"Hungary\", \"Ireland\", \"Italy\", \"Latvia\", \"Lithuania\", \"Luxembourg\", \"Malta\", \n",
    "                \"Netherlands\", \"Poland\", \"Portugal\", \"Romania\", \"Slovakia\", \"Slovenia\", \"Spain\", \"Sweden\"],\n",
    "    \"Total News Extracted\": [46145, 21287, 38118, 37068, 34955, 41415, 11312, 12370, 6647, 64527, \n",
    "                             45321, 49504, 18111, 48409, 93858, 5487, 14396, 7894, 10842, \n",
    "                             23935, 21434, 29624, 33264, 34874, 10211, 112820, 6417],\n",
    "    \"Date Range\": [\"Mar 06, 2023 - Mar 07, 2024\", \"Jun 07, 2023 - Mar 07, 2024\", \"Jul 07, 2023 - Mar 07, 2024\",\n",
    "                   \"Jul 07, 2023 - Mar 07, 2024\", \"Jul 07, 2023 - Mar 08, 2024\", \"Jul 07, 2023 - Mar 08, 2024\",\n",
    "                   \"Aug 07, 2023 - Mar 07, 2024\", \"Aug 08, 2023 - Mar 07, 2024\", \"Aug 08, 2023 - Mar 07, 2024\",\n",
    "                   \"Aug 07, 2023 - Mar 07, 2024\", \"Jan 08, 2024 - Mar 07, 2024\", \"Aug 08, 2023 - Mar 07, 2024\",\n",
    "                   \"Aug 08, 2023 - Mar 07, 2024\", \"Aug 08, 2023 - Mar 07, 2024\", \"Aug 08, 2023 - Mar 07, 2024\",\n",
    "                   \"Aug 09, 2023 - Mar 07, 2024\", \"Aug 08, 2023 - Mar 07, 2024\", \"Aug 08, 2023 - Mar 07, 2024\",\n",
    "                   \"Aug 08, 2023 - Mar 07, 2024\", \"Aug 08, 2023 - Mar 07, 2024\", \"Aug 08, 2023 - Mar 07, 2024\",\n",
    "                   \"Aug 08, 2023 - Mar 07, 2024\", \"Aug 08, 2023 - Mar 07, 2024\", \"Aug 08, 2023 - Mar 07, 2024\",\n",
    "                   \"Aug 08, 2023 - Mar 07, 2024\", \"Aug 08, 2023 - Mar 07, 2024\", \"Jan 08, 2024 - Mar 07, 2024\"]\n",
    "}\n",
    "\n",
    "tbl01 = pd.DataFrame(data_tbl01)\n",
    "total_row = pd.DataFrame([[\"Total\", sum(data_tbl01[\"Total News Extracted\"]), \"\"]], columns=tbl01.columns)\n",
    "tbl01_total = pd.concat([tbl01, total_row], ignore_index=True)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 4,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<style type=\"text/css\">\n",
       "</style>\n",
       "<table id=\"T_1f17c\">\n",
       "  <thead>\n",
       "    <tr>\n",
       "      <th id=\"T_1f17c_level0_col0\" class=\"col_heading level0 col0\" >Country</th>\n",
       "      <th id=\"T_1f17c_level0_col1\" class=\"col_heading level0 col1\" >Total News Extracted</th>\n",
       "      <th id=\"T_1f17c_level0_col2\" class=\"col_heading level0 col2\" >Date Range</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <td id=\"T_1f17c_row0_col0\" class=\"data row0 col0\" >Austria</td>\n",
       "      <td id=\"T_1f17c_row0_col1\" class=\"data row0 col1\" >46,145</td>\n",
       "      <td id=\"T_1f17c_row0_col2\" class=\"data row0 col2\" >Mar 06, 2023 - Mar 07, 2024</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_1f17c_row1_col0\" class=\"data row1 col0\" >Belgium</td>\n",
       "      <td id=\"T_1f17c_row1_col1\" class=\"data row1 col1\" >21,287</td>\n",
       "      <td id=\"T_1f17c_row1_col2\" class=\"data row1 col2\" >Jun 07, 2023 - Mar 07, 2024</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_1f17c_row2_col0\" class=\"data row2 col0\" >Bulgaria</td>\n",
       "      <td id=\"T_1f17c_row2_col1\" class=\"data row2 col1\" >38,118</td>\n",
       "      <td id=\"T_1f17c_row2_col2\" class=\"data row2 col2\" >Jul 07, 2023 - Mar 07, 2024</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_1f17c_row3_col0\" class=\"data row3 col0\" >Croatia</td>\n",
       "      <td id=\"T_1f17c_row3_col1\" class=\"data row3 col1\" >37,068</td>\n",
       "      <td id=\"T_1f17c_row3_col2\" class=\"data row3 col2\" >Jul 07, 2023 - Mar 07, 2024</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_1f17c_row4_col0\" class=\"data row4 col0\" >Cyprus</td>\n",
       "      <td id=\"T_1f17c_row4_col1\" class=\"data row4 col1\" >34,955</td>\n",
       "      <td id=\"T_1f17c_row4_col2\" class=\"data row4 col2\" >Jul 07, 2023 - Mar 08, 2024</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_1f17c_row5_col0\" class=\"data row5 col0\" >Czechia</td>\n",
       "      <td id=\"T_1f17c_row5_col1\" class=\"data row5 col1\" >41,415</td>\n",
       "      <td id=\"T_1f17c_row5_col2\" class=\"data row5 col2\" >Jul 07, 2023 - Mar 08, 2024</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_1f17c_row6_col0\" class=\"data row6 col0\" >Denmark</td>\n",
       "      <td id=\"T_1f17c_row6_col1\" class=\"data row6 col1\" >11,312</td>\n",
       "      <td id=\"T_1f17c_row6_col2\" class=\"data row6 col2\" >Aug 07, 2023 - Mar 07, 2024</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_1f17c_row7_col0\" class=\"data row7 col0\" >Estonia</td>\n",
       "      <td id=\"T_1f17c_row7_col1\" class=\"data row7 col1\" >12,370</td>\n",
       "      <td id=\"T_1f17c_row7_col2\" class=\"data row7 col2\" >Aug 08, 2023 - Mar 07, 2024</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_1f17c_row8_col0\" class=\"data row8 col0\" >Finland</td>\n",
       "      <td id=\"T_1f17c_row8_col1\" class=\"data row8 col1\" >6,647</td>\n",
       "      <td id=\"T_1f17c_row8_col2\" class=\"data row8 col2\" >Aug 08, 2023 - Mar 07, 2024</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_1f17c_row9_col0\" class=\"data row9 col0\" >France</td>\n",
       "      <td id=\"T_1f17c_row9_col1\" class=\"data row9 col1\" >64,527</td>\n",
       "      <td id=\"T_1f17c_row9_col2\" class=\"data row9 col2\" >Aug 07, 2023 - Mar 07, 2024</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_1f17c_row10_col0\" class=\"data row10 col0\" >Germany</td>\n",
       "      <td id=\"T_1f17c_row10_col1\" class=\"data row10 col1\" >45,321</td>\n",
       "      <td id=\"T_1f17c_row10_col2\" class=\"data row10 col2\" >Jan 08, 2024 - Mar 07, 2024</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_1f17c_row11_col0\" class=\"data row11 col0\" >Greece</td>\n",
       "      <td id=\"T_1f17c_row11_col1\" class=\"data row11 col1\" >49,504</td>\n",
       "      <td id=\"T_1f17c_row11_col2\" class=\"data row11 col2\" >Aug 08, 2023 - Mar 07, 2024</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_1f17c_row12_col0\" class=\"data row12 col0\" >Hungary</td>\n",
       "      <td id=\"T_1f17c_row12_col1\" class=\"data row12 col1\" >18,111</td>\n",
       "      <td id=\"T_1f17c_row12_col2\" class=\"data row12 col2\" >Aug 08, 2023 - Mar 07, 2024</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_1f17c_row13_col0\" class=\"data row13 col0\" >Ireland</td>\n",
       "      <td id=\"T_1f17c_row13_col1\" class=\"data row13 col1\" >48,409</td>\n",
       "      <td id=\"T_1f17c_row13_col2\" class=\"data row13 col2\" >Aug 08, 2023 - Mar 07, 2024</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_1f17c_row14_col0\" class=\"data row14 col0\" >Italy</td>\n",
       "      <td id=\"T_1f17c_row14_col1\" class=\"data row14 col1\" >93,858</td>\n",
       "      <td id=\"T_1f17c_row14_col2\" class=\"data row14 col2\" >Aug 08, 2023 - Mar 07, 2024</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_1f17c_row15_col0\" class=\"data row15 col0\" >Latvia</td>\n",
       "      <td id=\"T_1f17c_row15_col1\" class=\"data row15 col1\" >5,487</td>\n",
       "      <td id=\"T_1f17c_row15_col2\" class=\"data row15 col2\" >Aug 09, 2023 - Mar 07, 2024</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_1f17c_row16_col0\" class=\"data row16 col0\" >Lithuania</td>\n",
       "      <td id=\"T_1f17c_row16_col1\" class=\"data row16 col1\" >14,396</td>\n",
       "      <td id=\"T_1f17c_row16_col2\" class=\"data row16 col2\" >Aug 08, 2023 - Mar 07, 2024</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_1f17c_row17_col0\" class=\"data row17 col0\" >Luxembourg</td>\n",
       "      <td id=\"T_1f17c_row17_col1\" class=\"data row17 col1\" >7,894</td>\n",
       "      <td id=\"T_1f17c_row17_col2\" class=\"data row17 col2\" >Aug 08, 2023 - Mar 07, 2024</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_1f17c_row18_col0\" class=\"data row18 col0\" >Malta</td>\n",
       "      <td id=\"T_1f17c_row18_col1\" class=\"data row18 col1\" >10,842</td>\n",
       "      <td id=\"T_1f17c_row18_col2\" class=\"data row18 col2\" >Aug 08, 2023 - Mar 07, 2024</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_1f17c_row19_col0\" class=\"data row19 col0\" >Netherlands</td>\n",
       "      <td id=\"T_1f17c_row19_col1\" class=\"data row19 col1\" >23,935</td>\n",
       "      <td id=\"T_1f17c_row19_col2\" class=\"data row19 col2\" >Aug 08, 2023 - Mar 07, 2024</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_1f17c_row20_col0\" class=\"data row20 col0\" >Poland</td>\n",
       "      <td id=\"T_1f17c_row20_col1\" class=\"data row20 col1\" >21,434</td>\n",
       "      <td id=\"T_1f17c_row20_col2\" class=\"data row20 col2\" >Aug 08, 2023 - Mar 07, 2024</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_1f17c_row21_col0\" class=\"data row21 col0\" >Portugal</td>\n",
       "      <td id=\"T_1f17c_row21_col1\" class=\"data row21 col1\" >29,624</td>\n",
       "      <td id=\"T_1f17c_row21_col2\" class=\"data row21 col2\" >Aug 08, 2023 - Mar 07, 2024</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_1f17c_row22_col0\" class=\"data row22 col0\" >Romania</td>\n",
       "      <td id=\"T_1f17c_row22_col1\" class=\"data row22 col1\" >33,264</td>\n",
       "      <td id=\"T_1f17c_row22_col2\" class=\"data row22 col2\" >Aug 08, 2023 - Mar 07, 2024</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_1f17c_row23_col0\" class=\"data row23 col0\" >Slovakia</td>\n",
       "      <td id=\"T_1f17c_row23_col1\" class=\"data row23 col1\" >34,874</td>\n",
       "      <td id=\"T_1f17c_row23_col2\" class=\"data row23 col2\" >Aug 08, 2023 - Mar 07, 2024</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_1f17c_row24_col0\" class=\"data row24 col0\" >Slovenia</td>\n",
       "      <td id=\"T_1f17c_row24_col1\" class=\"data row24 col1\" >10,211</td>\n",
       "      <td id=\"T_1f17c_row24_col2\" class=\"data row24 col2\" >Aug 08, 2023 - Mar 07, 2024</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_1f17c_row25_col0\" class=\"data row25 col0\" >Spain</td>\n",
       "      <td id=\"T_1f17c_row25_col1\" class=\"data row25 col1\" >112,820</td>\n",
       "      <td id=\"T_1f17c_row25_col2\" class=\"data row25 col2\" >Aug 08, 2023 - Mar 07, 2024</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_1f17c_row26_col0\" class=\"data row26 col0\" >Sweden</td>\n",
       "      <td id=\"T_1f17c_row26_col1\" class=\"data row26 col1\" >6,417</td>\n",
       "      <td id=\"T_1f17c_row26_col2\" class=\"data row26 col2\" >Jan 08, 2024 - Mar 07, 2024</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_1f17c_row27_col0\" class=\"data row27 col0\" >Total</td>\n",
       "      <td id=\"T_1f17c_row27_col1\" class=\"data row27 col1\" >880,245</td>\n",
       "      <td id=\"T_1f17c_row27_col2\" class=\"data row27 col2\" ></td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n"
      ],
      "text/plain": [
       "<pandas.io.formats.style.Styler at 0x24e32a58190>"
      ]
     },
     "execution_count": 4,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "#| label: tbl-extraction\n",
    "#| tbl-cap: Total news extracted per country\n",
    "tbl01_total.style.hide(axis=\"index\").format({\n",
    "    'Total News Extracted': '{:,.0f}'\n",
    "})"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### Table 2: Failed Translation"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 5,
   "metadata": {},
   "outputs": [],
   "source": [
    "path2exdata = f\"{path2SP}/data-extraction-1/data4translation\"\n",
    "extracted_data = [pd.read_parquet(f\"{path2exdata}/{country}_tp.parquet.gzip\") for country in eu_member_states]\n",
    "exdata = pd.concat(extracted_data)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 24,
   "metadata": {},
   "outputs": [],
   "source": [
    "path2trdata = f\"{path2SP}/data-extraction-1/ready4class\"\n",
    "files = os.listdir(path2trdata)\n",
    "translated_data = [pd.read_parquet(f\"{path2trdata}/{x}\") for x in files]\n",
    "trdata = pd.concat(translated_data)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 45,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<style type=\"text/css\">\n",
       "</style>\n",
       "<table id=\"T_542c5\">\n",
       "  <thead>\n",
       "    <tr>\n",
       "      <th id=\"T_542c5_level0_col0\" class=\"col_heading level0 col0\" >Country</th>\n",
       "      <th id=\"T_542c5_level0_col1\" class=\"col_heading level0 col1\" >Extracted News (n)</th>\n",
       "      <th id=\"T_542c5_level0_col2\" class=\"col_heading level0 col2\" >Translated News (n)</th>\n",
       "      <th id=\"T_542c5_level0_col3\" class=\"col_heading level0 col3\" >Translated News (%)</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <td id=\"T_542c5_row0_col0\" class=\"data row0 col0\" >Austria</td>\n",
       "      <td id=\"T_542c5_row0_col1\" class=\"data row0 col1\" >46,145</td>\n",
       "      <td id=\"T_542c5_row0_col2\" class=\"data row0 col2\" >44,181</td>\n",
       "      <td id=\"T_542c5_row0_col3\" class=\"data row0 col3\" >95.7</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_542c5_row1_col0\" class=\"data row1 col0\" >Belgium</td>\n",
       "      <td id=\"T_542c5_row1_col1\" class=\"data row1 col1\" >21,287</td>\n",
       "      <td id=\"T_542c5_row1_col2\" class=\"data row1 col2\" >19,846</td>\n",
       "      <td id=\"T_542c5_row1_col3\" class=\"data row1 col3\" >93.2</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_542c5_row2_col0\" class=\"data row2 col0\" >Bulgaria</td>\n",
       "      <td id=\"T_542c5_row2_col1\" class=\"data row2 col1\" >38,118</td>\n",
       "      <td id=\"T_542c5_row2_col2\" class=\"data row2 col2\" >33,070</td>\n",
       "      <td id=\"T_542c5_row2_col3\" class=\"data row2 col3\" >86.8</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_542c5_row3_col0\" class=\"data row3 col0\" >Croatia</td>\n",
       "      <td id=\"T_542c5_row3_col1\" class=\"data row3 col1\" >37,068</td>\n",
       "      <td id=\"T_542c5_row3_col2\" class=\"data row3 col2\" >36,595</td>\n",
       "      <td id=\"T_542c5_row3_col3\" class=\"data row3 col3\" >98.7</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_542c5_row4_col0\" class=\"data row4 col0\" >Cyprus</td>\n",
       "      <td id=\"T_542c5_row4_col1\" class=\"data row4 col1\" >34,955</td>\n",
       "      <td id=\"T_542c5_row4_col2\" class=\"data row4 col2\" >33,772</td>\n",
       "      <td id=\"T_542c5_row4_col3\" class=\"data row4 col3\" >96.6</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_542c5_row5_col0\" class=\"data row5 col0\" >Czechia</td>\n",
       "      <td id=\"T_542c5_row5_col1\" class=\"data row5 col1\" >41,415</td>\n",
       "      <td id=\"T_542c5_row5_col2\" class=\"data row5 col2\" >40,620</td>\n",
       "      <td id=\"T_542c5_row5_col3\" class=\"data row5 col3\" >98.1</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_542c5_row6_col0\" class=\"data row6 col0\" >Denmark</td>\n",
       "      <td id=\"T_542c5_row6_col1\" class=\"data row6 col1\" >11,312</td>\n",
       "      <td id=\"T_542c5_row6_col2\" class=\"data row6 col2\" >10,761</td>\n",
       "      <td id=\"T_542c5_row6_col3\" class=\"data row6 col3\" >95.1</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_542c5_row7_col0\" class=\"data row7 col0\" >Estonia</td>\n",
       "      <td id=\"T_542c5_row7_col1\" class=\"data row7 col1\" >12,370</td>\n",
       "      <td id=\"T_542c5_row7_col2\" class=\"data row7 col2\" >11,334</td>\n",
       "      <td id=\"T_542c5_row7_col3\" class=\"data row7 col3\" >91.6</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_542c5_row8_col0\" class=\"data row8 col0\" >Finland</td>\n",
       "      <td id=\"T_542c5_row8_col1\" class=\"data row8 col1\" >6,647</td>\n",
       "      <td id=\"T_542c5_row8_col2\" class=\"data row8 col2\" >6,399</td>\n",
       "      <td id=\"T_542c5_row8_col3\" class=\"data row8 col3\" >96.3</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_542c5_row9_col0\" class=\"data row9 col0\" >France</td>\n",
       "      <td id=\"T_542c5_row9_col1\" class=\"data row9 col1\" >64,527</td>\n",
       "      <td id=\"T_542c5_row9_col2\" class=\"data row9 col2\" >62,900</td>\n",
       "      <td id=\"T_542c5_row9_col3\" class=\"data row9 col3\" >97.5</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_542c5_row10_col0\" class=\"data row10 col0\" >Germany</td>\n",
       "      <td id=\"T_542c5_row10_col1\" class=\"data row10 col1\" >45,321</td>\n",
       "      <td id=\"T_542c5_row10_col2\" class=\"data row10 col2\" >40,444</td>\n",
       "      <td id=\"T_542c5_row10_col3\" class=\"data row10 col3\" >89.2</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_542c5_row11_col0\" class=\"data row11 col0\" >Greece</td>\n",
       "      <td id=\"T_542c5_row11_col1\" class=\"data row11 col1\" >49,504</td>\n",
       "      <td id=\"T_542c5_row11_col2\" class=\"data row11 col2\" >47,182</td>\n",
       "      <td id=\"T_542c5_row11_col3\" class=\"data row11 col3\" >95.3</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_542c5_row12_col0\" class=\"data row12 col0\" >Hungary</td>\n",
       "      <td id=\"T_542c5_row12_col1\" class=\"data row12 col1\" >18,111</td>\n",
       "      <td id=\"T_542c5_row12_col2\" class=\"data row12 col2\" >17,965</td>\n",
       "      <td id=\"T_542c5_row12_col3\" class=\"data row12 col3\" >99.2</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_542c5_row13_col0\" class=\"data row13 col0\" >Ireland</td>\n",
       "      <td id=\"T_542c5_row13_col1\" class=\"data row13 col1\" >48,409</td>\n",
       "      <td id=\"T_542c5_row13_col2\" class=\"data row13 col2\" >48,409</td>\n",
       "      <td id=\"T_542c5_row13_col3\" class=\"data row13 col3\" >100.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_542c5_row14_col0\" class=\"data row14 col0\" >Italy</td>\n",
       "      <td id=\"T_542c5_row14_col1\" class=\"data row14 col1\" >93,858</td>\n",
       "      <td id=\"T_542c5_row14_col2\" class=\"data row14 col2\" >82,885</td>\n",
       "      <td id=\"T_542c5_row14_col3\" class=\"data row14 col3\" >88.3</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_542c5_row15_col0\" class=\"data row15 col0\" >Latvia</td>\n",
       "      <td id=\"T_542c5_row15_col1\" class=\"data row15 col1\" >5,487</td>\n",
       "      <td id=\"T_542c5_row15_col2\" class=\"data row15 col2\" >5,467</td>\n",
       "      <td id=\"T_542c5_row15_col3\" class=\"data row15 col3\" >99.6</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_542c5_row16_col0\" class=\"data row16 col0\" >Lithuania</td>\n",
       "      <td id=\"T_542c5_row16_col1\" class=\"data row16 col1\" >14,396</td>\n",
       "      <td id=\"T_542c5_row16_col2\" class=\"data row16 col2\" >13,287</td>\n",
       "      <td id=\"T_542c5_row16_col3\" class=\"data row16 col3\" >92.3</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_542c5_row17_col0\" class=\"data row17 col0\" >Luxembourg</td>\n",
       "      <td id=\"T_542c5_row17_col1\" class=\"data row17 col1\" >7,894</td>\n",
       "      <td id=\"T_542c5_row17_col2\" class=\"data row17 col2\" >7,636</td>\n",
       "      <td id=\"T_542c5_row17_col3\" class=\"data row17 col3\" >96.7</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_542c5_row18_col0\" class=\"data row18 col0\" >Malta</td>\n",
       "      <td id=\"T_542c5_row18_col1\" class=\"data row18 col1\" >10,842</td>\n",
       "      <td id=\"T_542c5_row18_col2\" class=\"data row18 col2\" >10,556</td>\n",
       "      <td id=\"T_542c5_row18_col3\" class=\"data row18 col3\" >97.4</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_542c5_row19_col0\" class=\"data row19 col0\" >Netherlands</td>\n",
       "      <td id=\"T_542c5_row19_col1\" class=\"data row19 col1\" >23,935</td>\n",
       "      <td id=\"T_542c5_row19_col2\" class=\"data row19 col2\" >22,642</td>\n",
       "      <td id=\"T_542c5_row19_col3\" class=\"data row19 col3\" >94.6</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_542c5_row20_col0\" class=\"data row20 col0\" >Poland</td>\n",
       "      <td id=\"T_542c5_row20_col1\" class=\"data row20 col1\" >21,434</td>\n",
       "      <td id=\"T_542c5_row20_col2\" class=\"data row20 col2\" >17,490</td>\n",
       "      <td id=\"T_542c5_row20_col3\" class=\"data row20 col3\" >81.6</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_542c5_row21_col0\" class=\"data row21 col0\" >Portugal</td>\n",
       "      <td id=\"T_542c5_row21_col1\" class=\"data row21 col1\" >29,624</td>\n",
       "      <td id=\"T_542c5_row21_col2\" class=\"data row21 col2\" >29,416</td>\n",
       "      <td id=\"T_542c5_row21_col3\" class=\"data row21 col3\" >99.3</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_542c5_row22_col0\" class=\"data row22 col0\" >Romania</td>\n",
       "      <td id=\"T_542c5_row22_col1\" class=\"data row22 col1\" >33,264</td>\n",
       "      <td id=\"T_542c5_row22_col2\" class=\"data row22 col2\" >32,234</td>\n",
       "      <td id=\"T_542c5_row22_col3\" class=\"data row22 col3\" >96.9</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_542c5_row23_col0\" class=\"data row23 col0\" >Slovakia</td>\n",
       "      <td id=\"T_542c5_row23_col1\" class=\"data row23 col1\" >34,874</td>\n",
       "      <td id=\"T_542c5_row23_col2\" class=\"data row23 col2\" >28,973</td>\n",
       "      <td id=\"T_542c5_row23_col3\" class=\"data row23 col3\" >83.1</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_542c5_row24_col0\" class=\"data row24 col0\" >Slovenia</td>\n",
       "      <td id=\"T_542c5_row24_col1\" class=\"data row24 col1\" >10,211</td>\n",
       "      <td id=\"T_542c5_row24_col2\" class=\"data row24 col2\" >9,818</td>\n",
       "      <td id=\"T_542c5_row24_col3\" class=\"data row24 col3\" >96.2</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_542c5_row25_col0\" class=\"data row25 col0\" >Spain</td>\n",
       "      <td id=\"T_542c5_row25_col1\" class=\"data row25 col1\" >112,820</td>\n",
       "      <td id=\"T_542c5_row25_col2\" class=\"data row25 col2\" >88,324</td>\n",
       "      <td id=\"T_542c5_row25_col3\" class=\"data row25 col3\" >78.3</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_542c5_row26_col0\" class=\"data row26 col0\" >Sweden</td>\n",
       "      <td id=\"T_542c5_row26_col1\" class=\"data row26 col1\" >6,417</td>\n",
       "      <td id=\"T_542c5_row26_col2\" class=\"data row26 col2\" >6,223</td>\n",
       "      <td id=\"T_542c5_row26_col3\" class=\"data row26 col3\" >97.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_542c5_row27_col0\" class=\"data row27 col0\" >European Union</td>\n",
       "      <td id=\"T_542c5_row27_col1\" class=\"data row27 col1\" >880,245</td>\n",
       "      <td id=\"T_542c5_row27_col2\" class=\"data row27 col2\" >808,429</td>\n",
       "      <td id=\"T_542c5_row27_col3\" class=\"data row27 col3\" >93.9</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n"
      ],
      "text/plain": [
       "<pandas.io.formats.style.Styler at 0x24f9a8c0690>"
      ]
     },
     "execution_count": 45,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "#| label: tbl-translation\n",
    "#| tbl-cap: Translation Process (Rate of Success)\n",
    "\n",
    "tbl02 = (\n",
    "    exdata.country.value_counts().reset_index().sort_values(\"country\")\n",
    "    .merge(\n",
    "        trdata.country.value_counts().reset_index(), \n",
    "        how = \"left\", \n",
    "        on  = \"country\"\n",
    "    )\n",
    "    .assign(\n",
    "        success = lambda df: (1-((df['count_x'] - df['count_y']) / df['count_x']))*100\n",
    "    )\n",
    "    .rename(\n",
    "        columns = {\n",
    "            \"country\": \"Country\",\n",
    "            \"count_x\": \"Extracted News (n)\",\n",
    "            \"count_y\": \"Translated News (n)\",\n",
    "            \"success\": \"Translated News (%)\"\n",
    "        },\n",
    "        # inplace = True\n",
    "    )\n",
    ")\n",
    "\n",
    "total_row = pd.DataFrame(\n",
    "    [[\n",
    "        \"European Union\", \n",
    "        tbl02[\"Extracted News (n)\"].sum(),\n",
    "        tbl02[\"Translated News (n)\"].sum(),\n",
    "        tbl02[\"Translated News (%)\"].mean(),\n",
    "    ]], \n",
    "    columns=tbl02.columns\n",
    ")\n",
    "tbl02_total = pd.concat([tbl02, total_row], ignore_index=True)\n",
    "\n",
    "tbl02_total.style.hide(axis=\"index\").format({\n",
    "    \"Extracted News (n)\": \"{:,.0f}\",\n",
    "    \"Translated News (n)\": \"{:,.0f}\",\n",
    "    \"Translated News (%)\": \"{:,.1f}\"\n",
    "})"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### Table 3: First Stage Classification"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 5,
   "metadata": {},
   "outputs": [],
   "source": [
    "path2cldata = f\"{path2SP}/data-classification-1/0_compiled\"\n",
    "\n",
    "mutate_dict = {\n",
    "    \"Unrelated\"      : 0,\n",
    "    \"Related\"        : 1,\n",
    "    \"Justice\"        : 1,\n",
    "    \"Governance\"     : 1,\n",
    "    \"Rule of Law\"    : 1,\n",
    "    \"Skipped article\": 2\n",
    "}"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 6,
   "metadata": {},
   "outputs": [],
   "source": [
    "cldata = [pd.read_parquet(f\"{path2cldata}/{country}_classified.parquet.gzip\") for country in eu_member_states]\n",
    "cldata_master = pd.concat(cldata)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 75,
   "metadata": {},
   "outputs": [],
   "source": [
    "data = []\n",
    "for country in eu_member_states:\n",
    "    file = f\"{path2cldata}/{country}_classified.parquet.gzip\"\n",
    "    df = pd.read_parquet(file)\n",
    "    df[\"topic_related\"] = df[\"topic_related\"].str.strip()\n",
    "    df[\"relation\"] = df[\"topic_related\"].replace(mutate_dict)\n",
    "\n",
    "    if country == \"Czechia\":\n",
    "        location_column = \"location_Czech\"\n",
    "    else:\n",
    "        location_column = f\"location_{country}\"\n",
    "\n",
    "    df[\"related_within\"] = df.apply(lambda row: row[location_column] and row[\"relation\"] == 1, axis=1)\n",
    "\n",
    "    total   = len(df)\n",
    "    related = (df.relation.value_counts()[1] / total)*100\n",
    "    within  = (df.related_within.value_counts()[True] / total)*100\n",
    "    within_ = (df.related_within.value_counts()[True])\n",
    "    skipped = (df.relation.value_counts()[2] / total)*100\n",
    "\n",
    "    dict = {\n",
    "        \"Country\": country,\n",
    "        \"Related (%)\" : related,\n",
    "        \"Related - Within (%)\": within,\n",
    "        \"Related - Within (n)\": within_,\n",
    "        \"Unclassified (%)\": skipped\n",
    "    }\n",
    "\n",
    "    data.append(dict)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 84,
   "metadata": {},
   "outputs": [],
   "source": [
    "tbl03 = pd.DataFrame(data)\n",
    "total_row = pd.DataFrame(\n",
    "    [[\n",
    "        \"European Union\", \n",
    "        tbl02[\"Related (%)\"].mean(),\n",
    "        tbl02[\"Related - Within (%)\"].mean(),\n",
    "        tbl02[\"Related - Within (n)\"].sum(),\n",
    "        tbl02[\"Unclassified (%)\"].mean(),\n",
    "    ]], \n",
    "    columns=tbl03.columns\n",
    ")\n",
    "tbl03_total = pd.concat([tbl03, total_row], ignore_index=True)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 85,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<style type=\"text/css\">\n",
       "</style>\n",
       "<table id=\"T_9487f\">\n",
       "  <thead>\n",
       "    <tr>\n",
       "      <th id=\"T_9487f_level0_col0\" class=\"col_heading level0 col0\" >Country</th>\n",
       "      <th id=\"T_9487f_level0_col1\" class=\"col_heading level0 col1\" >Related (%)</th>\n",
       "      <th id=\"T_9487f_level0_col2\" class=\"col_heading level0 col2\" >Related - Within (%)</th>\n",
       "      <th id=\"T_9487f_level0_col3\" class=\"col_heading level0 col3\" >Related - Within (n)</th>\n",
       "      <th id=\"T_9487f_level0_col4\" class=\"col_heading level0 col4\" >Unclassified (%)</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <td id=\"T_9487f_row0_col0\" class=\"data row0 col0\" >Austria</td>\n",
       "      <td id=\"T_9487f_row0_col1\" class=\"data row0 col1\" >24.9</td>\n",
       "      <td id=\"T_9487f_row0_col2\" class=\"data row0 col2\" >12.7</td>\n",
       "      <td id=\"T_9487f_row0_col3\" class=\"data row0 col3\" >5,590</td>\n",
       "      <td id=\"T_9487f_row0_col4\" class=\"data row0 col4\" >0.5</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_9487f_row1_col0\" class=\"data row1 col0\" >Belgium</td>\n",
       "      <td id=\"T_9487f_row1_col1\" class=\"data row1 col1\" >24.2</td>\n",
       "      <td id=\"T_9487f_row1_col2\" class=\"data row1 col2\" >13.8</td>\n",
       "      <td id=\"T_9487f_row1_col3\" class=\"data row1 col3\" >2,737</td>\n",
       "      <td id=\"T_9487f_row1_col4\" class=\"data row1 col4\" >1.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_9487f_row2_col0\" class=\"data row2 col0\" >Bulgaria</td>\n",
       "      <td id=\"T_9487f_row2_col1\" class=\"data row2 col1\" >35.1</td>\n",
       "      <td id=\"T_9487f_row2_col2\" class=\"data row2 col2\" >24.4</td>\n",
       "      <td id=\"T_9487f_row2_col3\" class=\"data row2 col3\" >8,071</td>\n",
       "      <td id=\"T_9487f_row2_col4\" class=\"data row2 col4\" >0.3</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_9487f_row3_col0\" class=\"data row3 col0\" >Croatia</td>\n",
       "      <td id=\"T_9487f_row3_col1\" class=\"data row3 col1\" >28.8</td>\n",
       "      <td id=\"T_9487f_row3_col2\" class=\"data row3 col2\" >17.6</td>\n",
       "      <td id=\"T_9487f_row3_col3\" class=\"data row3 col3\" >6,431</td>\n",
       "      <td id=\"T_9487f_row3_col4\" class=\"data row3 col4\" >0.8</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_9487f_row4_col0\" class=\"data row4 col0\" >Cyprus</td>\n",
       "      <td id=\"T_9487f_row4_col1\" class=\"data row4 col1\" >29.1</td>\n",
       "      <td id=\"T_9487f_row4_col2\" class=\"data row4 col2\" >19.9</td>\n",
       "      <td id=\"T_9487f_row4_col3\" class=\"data row4 col3\" >6,716</td>\n",
       "      <td id=\"T_9487f_row4_col4\" class=\"data row4 col4\" >0.3</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_9487f_row5_col0\" class=\"data row5 col0\" >Czechia</td>\n",
       "      <td id=\"T_9487f_row5_col1\" class=\"data row5 col1\" >21.8</td>\n",
       "      <td id=\"T_9487f_row5_col2\" class=\"data row5 col2\" >17.5</td>\n",
       "      <td id=\"T_9487f_row5_col3\" class=\"data row5 col3\" >7,114</td>\n",
       "      <td id=\"T_9487f_row5_col4\" class=\"data row5 col4\" >1.3</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_9487f_row6_col0\" class=\"data row6 col0\" >Denmark</td>\n",
       "      <td id=\"T_9487f_row6_col1\" class=\"data row6 col1\" >30.6</td>\n",
       "      <td id=\"T_9487f_row6_col2\" class=\"data row6 col2\" >17.6</td>\n",
       "      <td id=\"T_9487f_row6_col3\" class=\"data row6 col3\" >1,897</td>\n",
       "      <td id=\"T_9487f_row6_col4\" class=\"data row6 col4\" >0.9</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_9487f_row7_col0\" class=\"data row7 col0\" >Estonia</td>\n",
       "      <td id=\"T_9487f_row7_col1\" class=\"data row7 col1\" >22.5</td>\n",
       "      <td id=\"T_9487f_row7_col2\" class=\"data row7 col2\" >14.1</td>\n",
       "      <td id=\"T_9487f_row7_col3\" class=\"data row7 col3\" >1,599</td>\n",
       "      <td id=\"T_9487f_row7_col4\" class=\"data row7 col4\" >0.3</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_9487f_row8_col0\" class=\"data row8 col0\" >Finland</td>\n",
       "      <td id=\"T_9487f_row8_col1\" class=\"data row8 col1\" >32.8</td>\n",
       "      <td id=\"T_9487f_row8_col2\" class=\"data row8 col2\" >23.5</td>\n",
       "      <td id=\"T_9487f_row8_col3\" class=\"data row8 col3\" >1,501</td>\n",
       "      <td id=\"T_9487f_row8_col4\" class=\"data row8 col4\" >0.8</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_9487f_row9_col0\" class=\"data row9 col0\" >France</td>\n",
       "      <td id=\"T_9487f_row9_col1\" class=\"data row9 col1\" >26.5</td>\n",
       "      <td id=\"T_9487f_row9_col2\" class=\"data row9 col2\" >15.8</td>\n",
       "      <td id=\"T_9487f_row9_col3\" class=\"data row9 col3\" >9,955</td>\n",
       "      <td id=\"T_9487f_row9_col4\" class=\"data row9 col4\" >0.7</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_9487f_row10_col0\" class=\"data row10 col0\" >Germany</td>\n",
       "      <td id=\"T_9487f_row10_col1\" class=\"data row10 col1\" >29.4</td>\n",
       "      <td id=\"T_9487f_row10_col2\" class=\"data row10 col2\" >23.0</td>\n",
       "      <td id=\"T_9487f_row10_col3\" class=\"data row10 col3\" >9,292</td>\n",
       "      <td id=\"T_9487f_row10_col4\" class=\"data row10 col4\" >0.8</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_9487f_row11_col0\" class=\"data row11 col0\" >Greece</td>\n",
       "      <td id=\"T_9487f_row11_col1\" class=\"data row11 col1\" >26.6</td>\n",
       "      <td id=\"T_9487f_row11_col2\" class=\"data row11 col2\" >17.1</td>\n",
       "      <td id=\"T_9487f_row11_col3\" class=\"data row11 col3\" >8,027</td>\n",
       "      <td id=\"T_9487f_row11_col4\" class=\"data row11 col4\" >1.2</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_9487f_row12_col0\" class=\"data row12 col0\" >Hungary</td>\n",
       "      <td id=\"T_9487f_row12_col1\" class=\"data row12 col1\" >25.8</td>\n",
       "      <td id=\"T_9487f_row12_col2\" class=\"data row12 col2\" >15.4</td>\n",
       "      <td id=\"T_9487f_row12_col3\" class=\"data row12 col3\" >2,768</td>\n",
       "      <td id=\"T_9487f_row12_col4\" class=\"data row12 col4\" >0.8</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_9487f_row13_col0\" class=\"data row13 col0\" >Ireland</td>\n",
       "      <td id=\"T_9487f_row13_col1\" class=\"data row13 col1\" >8.0</td>\n",
       "      <td id=\"T_9487f_row13_col2\" class=\"data row13 col2\" >5.5</td>\n",
       "      <td id=\"T_9487f_row13_col3\" class=\"data row13 col3\" >2,676</td>\n",
       "      <td id=\"T_9487f_row13_col4\" class=\"data row13 col4\" >0.2</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_9487f_row14_col0\" class=\"data row14 col0\" >Italy</td>\n",
       "      <td id=\"T_9487f_row14_col1\" class=\"data row14 col1\" >29.1</td>\n",
       "      <td id=\"T_9487f_row14_col2\" class=\"data row14 col2\" >24.1</td>\n",
       "      <td id=\"T_9487f_row14_col3\" class=\"data row14 col3\" >18,800</td>\n",
       "      <td id=\"T_9487f_row14_col4\" class=\"data row14 col4\" >0.8</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_9487f_row15_col0\" class=\"data row15 col0\" >Latvia</td>\n",
       "      <td id=\"T_9487f_row15_col1\" class=\"data row15 col1\" >15.1</td>\n",
       "      <td id=\"T_9487f_row15_col2\" class=\"data row15 col2\" >11.6</td>\n",
       "      <td id=\"T_9487f_row15_col3\" class=\"data row15 col3\" >636</td>\n",
       "      <td id=\"T_9487f_row15_col4\" class=\"data row15 col4\" >0.6</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_9487f_row16_col0\" class=\"data row16 col0\" >Lithuania</td>\n",
       "      <td id=\"T_9487f_row16_col1\" class=\"data row16 col1\" >31.5</td>\n",
       "      <td id=\"T_9487f_row16_col2\" class=\"data row16 col2\" >24.6</td>\n",
       "      <td id=\"T_9487f_row16_col3\" class=\"data row16 col3\" >3,272</td>\n",
       "      <td id=\"T_9487f_row16_col4\" class=\"data row16 col4\" >0.7</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_9487f_row17_col0\" class=\"data row17 col0\" >Luxembourg</td>\n",
       "      <td id=\"T_9487f_row17_col1\" class=\"data row17 col1\" >26.7</td>\n",
       "      <td id=\"T_9487f_row17_col2\" class=\"data row17 col2\" >14.7</td>\n",
       "      <td id=\"T_9487f_row17_col3\" class=\"data row17 col3\" >1,119</td>\n",
       "      <td id=\"T_9487f_row17_col4\" class=\"data row17 col4\" >0.5</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_9487f_row18_col0\" class=\"data row18 col0\" >Malta</td>\n",
       "      <td id=\"T_9487f_row18_col1\" class=\"data row18 col1\" >37.6</td>\n",
       "      <td id=\"T_9487f_row18_col2\" class=\"data row18 col2\" >30.4</td>\n",
       "      <td id=\"T_9487f_row18_col3\" class=\"data row18 col3\" >3,205</td>\n",
       "      <td id=\"T_9487f_row18_col4\" class=\"data row18 col4\" >0.4</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_9487f_row19_col0\" class=\"data row19 col0\" >Netherlands</td>\n",
       "      <td id=\"T_9487f_row19_col1\" class=\"data row19 col1\" >24.8</td>\n",
       "      <td id=\"T_9487f_row19_col2\" class=\"data row19 col2\" >14.2</td>\n",
       "      <td id=\"T_9487f_row19_col3\" class=\"data row19 col3\" >3,223</td>\n",
       "      <td id=\"T_9487f_row19_col4\" class=\"data row19 col4\" >0.6</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_9487f_row20_col0\" class=\"data row20 col0\" >Poland</td>\n",
       "      <td id=\"T_9487f_row20_col1\" class=\"data row20 col1\" >40.7</td>\n",
       "      <td id=\"T_9487f_row20_col2\" class=\"data row20 col2\" >33.7</td>\n",
       "      <td id=\"T_9487f_row20_col3\" class=\"data row20 col3\" >5,902</td>\n",
       "      <td id=\"T_9487f_row20_col4\" class=\"data row20 col4\" >0.8</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_9487f_row21_col0\" class=\"data row21 col0\" >Portugal</td>\n",
       "      <td id=\"T_9487f_row21_col1\" class=\"data row21 col1\" >23.2</td>\n",
       "      <td id=\"T_9487f_row21_col2\" class=\"data row21 col2\" >14.8</td>\n",
       "      <td id=\"T_9487f_row21_col3\" class=\"data row21 col3\" >4,217</td>\n",
       "      <td id=\"T_9487f_row21_col4\" class=\"data row21 col4\" >0.3</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_9487f_row22_col0\" class=\"data row22 col0\" >Romania</td>\n",
       "      <td id=\"T_9487f_row22_col1\" class=\"data row22 col1\" >43.6</td>\n",
       "      <td id=\"T_9487f_row22_col2\" class=\"data row22 col2\" >27.2</td>\n",
       "      <td id=\"T_9487f_row22_col3\" class=\"data row22 col3\" >8,765</td>\n",
       "      <td id=\"T_9487f_row22_col4\" class=\"data row22 col4\" >1.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_9487f_row23_col0\" class=\"data row23 col0\" >Slovakia</td>\n",
       "      <td id=\"T_9487f_row23_col1\" class=\"data row23 col1\" >26.8</td>\n",
       "      <td id=\"T_9487f_row23_col2\" class=\"data row23 col2\" >17.9</td>\n",
       "      <td id=\"T_9487f_row23_col3\" class=\"data row23 col3\" >5,172</td>\n",
       "      <td id=\"T_9487f_row23_col4\" class=\"data row23 col4\" >0.4</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_9487f_row24_col0\" class=\"data row24 col0\" >Slovenia</td>\n",
       "      <td id=\"T_9487f_row24_col1\" class=\"data row24 col1\" >30.7</td>\n",
       "      <td id=\"T_9487f_row24_col2\" class=\"data row24 col2\" >18.2</td>\n",
       "      <td id=\"T_9487f_row24_col3\" class=\"data row24 col3\" >1,786</td>\n",
       "      <td id=\"T_9487f_row24_col4\" class=\"data row24 col4\" >0.7</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_9487f_row25_col0\" class=\"data row25 col0\" >Spain</td>\n",
       "      <td id=\"T_9487f_row25_col1\" class=\"data row25 col1\" >27.7</td>\n",
       "      <td id=\"T_9487f_row25_col2\" class=\"data row25 col2\" >18.9</td>\n",
       "      <td id=\"T_9487f_row25_col3\" class=\"data row25 col3\" >16,685</td>\n",
       "      <td id=\"T_9487f_row25_col4\" class=\"data row25 col4\" >1.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_9487f_row26_col0\" class=\"data row26 col0\" >Sweden</td>\n",
       "      <td id=\"T_9487f_row26_col1\" class=\"data row26 col1\" >26.7</td>\n",
       "      <td id=\"T_9487f_row26_col2\" class=\"data row26 col2\" >15.6</td>\n",
       "      <td id=\"T_9487f_row26_col3\" class=\"data row26 col3\" >968</td>\n",
       "      <td id=\"T_9487f_row26_col4\" class=\"data row26 col4\" >2.5</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_9487f_row27_col0\" class=\"data row27 col0\" >European Union</td>\n",
       "      <td id=\"T_9487f_row27_col1\" class=\"data row27 col1\" >27.8</td>\n",
       "      <td id=\"T_9487f_row27_col2\" class=\"data row27 col2\" >18.7</td>\n",
       "      <td id=\"T_9487f_row27_col3\" class=\"data row27 col3\" >148,124</td>\n",
       "      <td id=\"T_9487f_row27_col4\" class=\"data row27 col4\" >0.8</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n"
      ],
      "text/plain": [
       "<pandas.io.formats.style.Styler at 0x1d8fc8d44d0>"
      ]
     },
     "execution_count": 85,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "#| label: tbl-classstage1\n",
    "#| tbl-cap: Broad classification results\n",
    "tbl03_total.style.hide(axis=\"index\").format({\n",
    "    \"Related (%)\": \"{:,.1f}\",\n",
    "    \"Related - Within (%)\": \"{:,.1f}\",\n",
    "    \"Related - Within (n)\": \"{:,.0f}\",\n",
    "    \"Unclassified (%)\": \"{:,.1f}\"\n",
    "})"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "### Table 4: Second Stage Classification"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 27,
   "metadata": {},
   "outputs": [],
   "source": [
    "tbl04_data = (\n",
    "    cldata_master.copy()\n",
    "    .drop_duplicates(subset = \"id\")\n",
    "    .loc[:,[\"country\", \"pillar_1\", \"pillar_2\", \"pillar_3\", \"pillar_4\", \"pillar_5\", \"pillar_6\", \"pillar_7\", \"pillar_8\"]]\n",
    "    .groupby(\"country\")\n",
    "    .agg(\"mean\")\n",
    "    .apply(lambda x: x*100)\n",
    "    .reset_index()\n",
    "    .rename(\n",
    "        columns = {\n",
    "            \"country\" : \"Country\",\n",
    "            \"pillar_1\": \"Pillar 1\",\n",
    "            \"pillar_2\": \"Pillar 2\",\n",
    "            \"pillar_3\": \"Pillar 3\",\n",
    "            \"pillar_4\": \"Pillar 4\",\n",
    "            \"pillar_5\": \"Pillar 5\",\n",
    "            \"pillar_6\": \"Pillar 6\",\n",
    "            \"pillar_7\": \"Pillar 7\",\n",
    "            \"pillar_8\": \"Pillar 8\",\n",
    "        }\n",
    "    )\n",
    ")\n",
    "total_row = pd.DataFrame(\n",
    "    [[\"European Union\"] + tbl04_data.iloc[:, 1:].mean().values.tolist()], \n",
    "    columns=tbl04_data.columns\n",
    ")\n",
    "tbl04_total = pd.concat([tbl04_data, total_row], ignore_index=True)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 28,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/html": [
       "<style type=\"text/css\">\n",
       "</style>\n",
       "<table id=\"T_259f0\">\n",
       "  <thead>\n",
       "    <tr>\n",
       "      <th id=\"T_259f0_level0_col0\" class=\"col_heading level0 col0\" >Country</th>\n",
       "      <th id=\"T_259f0_level0_col1\" class=\"col_heading level0 col1\" >Pillar 1</th>\n",
       "      <th id=\"T_259f0_level0_col2\" class=\"col_heading level0 col2\" >Pillar 2</th>\n",
       "      <th id=\"T_259f0_level0_col3\" class=\"col_heading level0 col3\" >Pillar 3</th>\n",
       "      <th id=\"T_259f0_level0_col4\" class=\"col_heading level0 col4\" >Pillar 4</th>\n",
       "      <th id=\"T_259f0_level0_col5\" class=\"col_heading level0 col5\" >Pillar 5</th>\n",
       "      <th id=\"T_259f0_level0_col6\" class=\"col_heading level0 col6\" >Pillar 6</th>\n",
       "      <th id=\"T_259f0_level0_col7\" class=\"col_heading level0 col7\" >Pillar 7</th>\n",
       "      <th id=\"T_259f0_level0_col8\" class=\"col_heading level0 col8\" >Pillar 8</th>\n",
       "    </tr>\n",
       "  </thead>\n",
       "  <tbody>\n",
       "    <tr>\n",
       "      <td id=\"T_259f0_row0_col0\" class=\"data row0 col0\" >Austria</td>\n",
       "      <td id=\"T_259f0_row0_col1\" class=\"data row0 col1\" >18.9</td>\n",
       "      <td id=\"T_259f0_row0_col2\" class=\"data row0 col2\" >9.8</td>\n",
       "      <td id=\"T_259f0_row0_col3\" class=\"data row0 col3\" >2.2</td>\n",
       "      <td id=\"T_259f0_row0_col4\" class=\"data row0 col4\" >15.3</td>\n",
       "      <td id=\"T_259f0_row0_col5\" class=\"data row0 col5\" >5.8</td>\n",
       "      <td id=\"T_259f0_row0_col6\" class=\"data row0 col6\" >2.5</td>\n",
       "      <td id=\"T_259f0_row0_col7\" class=\"data row0 col7\" >6.1</td>\n",
       "      <td id=\"T_259f0_row0_col8\" class=\"data row0 col8\" >15.8</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_259f0_row1_col0\" class=\"data row1 col0\" >Belgium</td>\n",
       "      <td id=\"T_259f0_row1_col1\" class=\"data row1 col1\" >13.3</td>\n",
       "      <td id=\"T_259f0_row1_col2\" class=\"data row1 col2\" >9.0</td>\n",
       "      <td id=\"T_259f0_row1_col3\" class=\"data row1 col3\" >1.4</td>\n",
       "      <td id=\"T_259f0_row1_col4\" class=\"data row1 col4\" >12.8</td>\n",
       "      <td id=\"T_259f0_row1_col5\" class=\"data row1 col5\" >5.8</td>\n",
       "      <td id=\"T_259f0_row1_col6\" class=\"data row1 col6\" >1.9</td>\n",
       "      <td id=\"T_259f0_row1_col7\" class=\"data row1 col7\" >6.5</td>\n",
       "      <td id=\"T_259f0_row1_col8\" class=\"data row1 col8\" >17.1</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_259f0_row2_col0\" class=\"data row2 col0\" >Bulgaria</td>\n",
       "      <td id=\"T_259f0_row2_col1\" class=\"data row2 col1\" >27.4</td>\n",
       "      <td id=\"T_259f0_row2_col2\" class=\"data row2 col2\" >16.7</td>\n",
       "      <td id=\"T_259f0_row2_col3\" class=\"data row2 col3\" >3.6</td>\n",
       "      <td id=\"T_259f0_row2_col4\" class=\"data row2 col4\" >17.8</td>\n",
       "      <td id=\"T_259f0_row2_col5\" class=\"data row2 col5\" >8.1</td>\n",
       "      <td id=\"T_259f0_row2_col6\" class=\"data row2 col6\" >5.2</td>\n",
       "      <td id=\"T_259f0_row2_col7\" class=\"data row2 col7\" >9.2</td>\n",
       "      <td id=\"T_259f0_row2_col8\" class=\"data row2 col8\" >21.3</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_259f0_row3_col0\" class=\"data row3 col0\" >Croatia</td>\n",
       "      <td id=\"T_259f0_row3_col1\" class=\"data row3 col1\" >20.6</td>\n",
       "      <td id=\"T_259f0_row3_col2\" class=\"data row3 col2\" >13.0</td>\n",
       "      <td id=\"T_259f0_row3_col3\" class=\"data row3 col3\" >2.3</td>\n",
       "      <td id=\"T_259f0_row3_col4\" class=\"data row3 col4\" >15.6</td>\n",
       "      <td id=\"T_259f0_row3_col5\" class=\"data row3 col5\" >8.1</td>\n",
       "      <td id=\"T_259f0_row3_col6\" class=\"data row3 col6\" >3.0</td>\n",
       "      <td id=\"T_259f0_row3_col7\" class=\"data row3 col7\" >6.5</td>\n",
       "      <td id=\"T_259f0_row3_col8\" class=\"data row3 col8\" >19.8</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_259f0_row4_col0\" class=\"data row4 col0\" >Cyprus</td>\n",
       "      <td id=\"T_259f0_row4_col1\" class=\"data row4 col1\" >22.6</td>\n",
       "      <td id=\"T_259f0_row4_col2\" class=\"data row4 col2\" >13.7</td>\n",
       "      <td id=\"T_259f0_row4_col3\" class=\"data row4 col3\" >3.9</td>\n",
       "      <td id=\"T_259f0_row4_col4\" class=\"data row4 col4\" >16.2</td>\n",
       "      <td id=\"T_259f0_row4_col5\" class=\"data row4 col5\" >7.5</td>\n",
       "      <td id=\"T_259f0_row4_col6\" class=\"data row4 col6\" >6.1</td>\n",
       "      <td id=\"T_259f0_row4_col7\" class=\"data row4 col7\" >7.9</td>\n",
       "      <td id=\"T_259f0_row4_col8\" class=\"data row4 col8\" >15.6</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_259f0_row5_col0\" class=\"data row5 col0\" >Czechia</td>\n",
       "      <td id=\"T_259f0_row5_col1\" class=\"data row5 col1\" >14.7</td>\n",
       "      <td id=\"T_259f0_row5_col2\" class=\"data row5 col2\" >9.1</td>\n",
       "      <td id=\"T_259f0_row5_col3\" class=\"data row5 col3\" >1.7</td>\n",
       "      <td id=\"T_259f0_row5_col4\" class=\"data row5 col4\" >10.8</td>\n",
       "      <td id=\"T_259f0_row5_col5\" class=\"data row5 col5\" >6.6</td>\n",
       "      <td id=\"T_259f0_row5_col6\" class=\"data row5 col6\" >2.7</td>\n",
       "      <td id=\"T_259f0_row5_col7\" class=\"data row5 col7\" >4.6</td>\n",
       "      <td id=\"T_259f0_row5_col8\" class=\"data row5 col8\" >14.6</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_259f0_row6_col0\" class=\"data row6 col0\" >Denmark</td>\n",
       "      <td id=\"T_259f0_row6_col1\" class=\"data row6 col1\" >24.3</td>\n",
       "      <td id=\"T_259f0_row6_col2\" class=\"data row6 col2\" >12.8</td>\n",
       "      <td id=\"T_259f0_row6_col3\" class=\"data row6 col3\" >3.0</td>\n",
       "      <td id=\"T_259f0_row6_col4\" class=\"data row6 col4\" >20.2</td>\n",
       "      <td id=\"T_259f0_row6_col5\" class=\"data row6 col5\" >9.2</td>\n",
       "      <td id=\"T_259f0_row6_col6\" class=\"data row6 col6\" >3.0</td>\n",
       "      <td id=\"T_259f0_row6_col7\" class=\"data row6 col7\" >8.2</td>\n",
       "      <td id=\"T_259f0_row6_col8\" class=\"data row6 col8\" >20.5</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_259f0_row7_col0\" class=\"data row7 col0\" >Estonia</td>\n",
       "      <td id=\"T_259f0_row7_col1\" class=\"data row7 col1\" >16.9</td>\n",
       "      <td id=\"T_259f0_row7_col2\" class=\"data row7 col2\" >8.9</td>\n",
       "      <td id=\"T_259f0_row7_col3\" class=\"data row7 col3\" >2.0</td>\n",
       "      <td id=\"T_259f0_row7_col4\" class=\"data row7 col4\" >11.7</td>\n",
       "      <td id=\"T_259f0_row7_col5\" class=\"data row7 col5\" >4.3</td>\n",
       "      <td id=\"T_259f0_row7_col6\" class=\"data row7 col6\" >3.4</td>\n",
       "      <td id=\"T_259f0_row7_col7\" class=\"data row7 col7\" >5.9</td>\n",
       "      <td id=\"T_259f0_row7_col8\" class=\"data row7 col8\" >13.2</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_259f0_row8_col0\" class=\"data row8 col0\" >Finland</td>\n",
       "      <td id=\"T_259f0_row8_col1\" class=\"data row8 col1\" >24.2</td>\n",
       "      <td id=\"T_259f0_row8_col2\" class=\"data row8 col2\" >12.9</td>\n",
       "      <td id=\"T_259f0_row8_col3\" class=\"data row8 col3\" >1.9</td>\n",
       "      <td id=\"T_259f0_row8_col4\" class=\"data row8 col4\" >20.3</td>\n",
       "      <td id=\"T_259f0_row8_col5\" class=\"data row8 col5\" >10.2</td>\n",
       "      <td id=\"T_259f0_row8_col6\" class=\"data row8 col6\" >3.6</td>\n",
       "      <td id=\"T_259f0_row8_col7\" class=\"data row8 col7\" >8.2</td>\n",
       "      <td id=\"T_259f0_row8_col8\" class=\"data row8 col8\" >22.5</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_259f0_row9_col0\" class=\"data row9 col0\" >France</td>\n",
       "      <td id=\"T_259f0_row9_col1\" class=\"data row9 col1\" >20.5</td>\n",
       "      <td id=\"T_259f0_row9_col2\" class=\"data row9 col2\" >9.7</td>\n",
       "      <td id=\"T_259f0_row9_col3\" class=\"data row9 col3\" >2.3</td>\n",
       "      <td id=\"T_259f0_row9_col4\" class=\"data row9 col4\" >18.5</td>\n",
       "      <td id=\"T_259f0_row9_col5\" class=\"data row9 col5\" >7.1</td>\n",
       "      <td id=\"T_259f0_row9_col6\" class=\"data row9 col6\" >3.1</td>\n",
       "      <td id=\"T_259f0_row9_col7\" class=\"data row9 col7\" >5.6</td>\n",
       "      <td id=\"T_259f0_row9_col8\" class=\"data row9 col8\" >15.3</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_259f0_row10_col0\" class=\"data row10 col0\" >Germany</td>\n",
       "      <td id=\"T_259f0_row10_col1\" class=\"data row10 col1\" >20.9</td>\n",
       "      <td id=\"T_259f0_row10_col2\" class=\"data row10 col2\" >9.5</td>\n",
       "      <td id=\"T_259f0_row10_col3\" class=\"data row10 col3\" >2.1</td>\n",
       "      <td id=\"T_259f0_row10_col4\" class=\"data row10 col4\" >17.7</td>\n",
       "      <td id=\"T_259f0_row10_col5\" class=\"data row10 col5\" >9.2</td>\n",
       "      <td id=\"T_259f0_row10_col6\" class=\"data row10 col6\" >2.5</td>\n",
       "      <td id=\"T_259f0_row10_col7\" class=\"data row10 col7\" >7.0</td>\n",
       "      <td id=\"T_259f0_row10_col8\" class=\"data row10 col8\" >19.4</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_259f0_row11_col0\" class=\"data row11 col0\" >Greece</td>\n",
       "      <td id=\"T_259f0_row11_col1\" class=\"data row11 col1\" >20.2</td>\n",
       "      <td id=\"T_259f0_row11_col2\" class=\"data row11 col2\" >12.1</td>\n",
       "      <td id=\"T_259f0_row11_col3\" class=\"data row11 col3\" >2.6</td>\n",
       "      <td id=\"T_259f0_row11_col4\" class=\"data row11 col4\" >16.7</td>\n",
       "      <td id=\"T_259f0_row11_col5\" class=\"data row11 col5\" >8.6</td>\n",
       "      <td id=\"T_259f0_row11_col6\" class=\"data row11 col6\" >3.9</td>\n",
       "      <td id=\"T_259f0_row11_col7\" class=\"data row11 col7\" >6.3</td>\n",
       "      <td id=\"T_259f0_row11_col8\" class=\"data row11 col8\" >17.4</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_259f0_row12_col0\" class=\"data row12 col0\" >Hungary</td>\n",
       "      <td id=\"T_259f0_row12_col1\" class=\"data row12 col1\" >21.8</td>\n",
       "      <td id=\"T_259f0_row12_col2\" class=\"data row12 col2\" >13.2</td>\n",
       "      <td id=\"T_259f0_row12_col3\" class=\"data row12 col3\" >2.6</td>\n",
       "      <td id=\"T_259f0_row12_col4\" class=\"data row12 col4\" >16.4</td>\n",
       "      <td id=\"T_259f0_row12_col5\" class=\"data row12 col5\" >5.9</td>\n",
       "      <td id=\"T_259f0_row12_col6\" class=\"data row12 col6\" >3.6</td>\n",
       "      <td id=\"T_259f0_row12_col7\" class=\"data row12 col7\" >4.0</td>\n",
       "      <td id=\"T_259f0_row12_col8\" class=\"data row12 col8\" >14.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_259f0_row13_col0\" class=\"data row13 col0\" >Ireland</td>\n",
       "      <td id=\"T_259f0_row13_col1\" class=\"data row13 col1\" >18.6</td>\n",
       "      <td id=\"T_259f0_row13_col2\" class=\"data row13 col2\" >9.4</td>\n",
       "      <td id=\"T_259f0_row13_col3\" class=\"data row13 col3\" >2.7</td>\n",
       "      <td id=\"T_259f0_row13_col4\" class=\"data row13 col4\" >16.5</td>\n",
       "      <td id=\"T_259f0_row13_col5\" class=\"data row13 col5\" >7.0</td>\n",
       "      <td id=\"T_259f0_row13_col6\" class=\"data row13 col6\" >3.7</td>\n",
       "      <td id=\"T_259f0_row13_col7\" class=\"data row13 col7\" >8.0</td>\n",
       "      <td id=\"T_259f0_row13_col8\" class=\"data row13 col8\" >16.2</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_259f0_row14_col0\" class=\"data row14 col0\" >Italy</td>\n",
       "      <td id=\"T_259f0_row14_col1\" class=\"data row14 col1\" >17.9</td>\n",
       "      <td id=\"T_259f0_row14_col2\" class=\"data row14 col2\" >12.3</td>\n",
       "      <td id=\"T_259f0_row14_col3\" class=\"data row14 col3\" >2.5</td>\n",
       "      <td id=\"T_259f0_row14_col4\" class=\"data row14 col4\" >17.2</td>\n",
       "      <td id=\"T_259f0_row14_col5\" class=\"data row14 col5\" >8.2</td>\n",
       "      <td id=\"T_259f0_row14_col6\" class=\"data row14 col6\" >4.1</td>\n",
       "      <td id=\"T_259f0_row14_col7\" class=\"data row14 col7\" >7.4</td>\n",
       "      <td id=\"T_259f0_row14_col8\" class=\"data row14 col8\" >18.4</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_259f0_row15_col0\" class=\"data row15 col0\" >Latvia</td>\n",
       "      <td id=\"T_259f0_row15_col1\" class=\"data row15 col1\" >10.4</td>\n",
       "      <td id=\"T_259f0_row15_col2\" class=\"data row15 col2\" >6.1</td>\n",
       "      <td id=\"T_259f0_row15_col3\" class=\"data row15 col3\" >2.0</td>\n",
       "      <td id=\"T_259f0_row15_col4\" class=\"data row15 col4\" >7.5</td>\n",
       "      <td id=\"T_259f0_row15_col5\" class=\"data row15 col5\" >3.1</td>\n",
       "      <td id=\"T_259f0_row15_col6\" class=\"data row15 col6\" >3.3</td>\n",
       "      <td id=\"T_259f0_row15_col7\" class=\"data row15 col7\" >2.1</td>\n",
       "      <td id=\"T_259f0_row15_col8\" class=\"data row15 col8\" >6.2</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_259f0_row16_col0\" class=\"data row16 col0\" >Lithuania</td>\n",
       "      <td id=\"T_259f0_row16_col1\" class=\"data row16 col1\" >22.7</td>\n",
       "      <td id=\"T_259f0_row16_col2\" class=\"data row16 col2\" >14.1</td>\n",
       "      <td id=\"T_259f0_row16_col3\" class=\"data row16 col3\" >2.4</td>\n",
       "      <td id=\"T_259f0_row16_col4\" class=\"data row16 col4\" >15.3</td>\n",
       "      <td id=\"T_259f0_row16_col5\" class=\"data row16 col5\" >6.6</td>\n",
       "      <td id=\"T_259f0_row16_col6\" class=\"data row16 col6\" >4.4</td>\n",
       "      <td id=\"T_259f0_row16_col7\" class=\"data row16 col7\" >7.7</td>\n",
       "      <td id=\"T_259f0_row16_col8\" class=\"data row16 col8\" >20.7</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_259f0_row17_col0\" class=\"data row17 col0\" >Luxembourg</td>\n",
       "      <td id=\"T_259f0_row17_col1\" class=\"data row17 col1\" >16.4</td>\n",
       "      <td id=\"T_259f0_row17_col2\" class=\"data row17 col2\" >8.3</td>\n",
       "      <td id=\"T_259f0_row17_col3\" class=\"data row17 col3\" >3.8</td>\n",
       "      <td id=\"T_259f0_row17_col4\" class=\"data row17 col4\" >15.8</td>\n",
       "      <td id=\"T_259f0_row17_col5\" class=\"data row17 col5\" >6.6</td>\n",
       "      <td id=\"T_259f0_row17_col6\" class=\"data row17 col6\" >3.7</td>\n",
       "      <td id=\"T_259f0_row17_col7\" class=\"data row17 col7\" >5.8</td>\n",
       "      <td id=\"T_259f0_row17_col8\" class=\"data row17 col8\" >13.1</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_259f0_row18_col0\" class=\"data row18 col0\" >Malta</td>\n",
       "      <td id=\"T_259f0_row18_col1\" class=\"data row18 col1\" >30.1</td>\n",
       "      <td id=\"T_259f0_row18_col2\" class=\"data row18 col2\" >19.3</td>\n",
       "      <td id=\"T_259f0_row18_col3\" class=\"data row18 col3\" >7.4</td>\n",
       "      <td id=\"T_259f0_row18_col4\" class=\"data row18 col4\" >24.0</td>\n",
       "      <td id=\"T_259f0_row18_col5\" class=\"data row18 col5\" >6.4</td>\n",
       "      <td id=\"T_259f0_row18_col6\" class=\"data row18 col6\" >9.2</td>\n",
       "      <td id=\"T_259f0_row18_col7\" class=\"data row18 col7\" >13.0</td>\n",
       "      <td id=\"T_259f0_row18_col8\" class=\"data row18 col8\" >21.4</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_259f0_row19_col0\" class=\"data row19 col0\" >Netherlands</td>\n",
       "      <td id=\"T_259f0_row19_col1\" class=\"data row19 col1\" >16.6</td>\n",
       "      <td id=\"T_259f0_row19_col2\" class=\"data row19 col2\" >9.6</td>\n",
       "      <td id=\"T_259f0_row19_col3\" class=\"data row19 col3\" >2.6</td>\n",
       "      <td id=\"T_259f0_row19_col4\" class=\"data row19 col4\" >15.5</td>\n",
       "      <td id=\"T_259f0_row19_col5\" class=\"data row19 col5\" >5.6</td>\n",
       "      <td id=\"T_259f0_row19_col6\" class=\"data row19 col6\" >3.0</td>\n",
       "      <td id=\"T_259f0_row19_col7\" class=\"data row19 col7\" >6.0</td>\n",
       "      <td id=\"T_259f0_row19_col8\" class=\"data row19 col8\" >14.8</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_259f0_row20_col0\" class=\"data row20 col0\" >Poland</td>\n",
       "      <td id=\"T_259f0_row20_col1\" class=\"data row20 col1\" >31.6</td>\n",
       "      <td id=\"T_259f0_row20_col2\" class=\"data row20 col2\" >18.1</td>\n",
       "      <td id=\"T_259f0_row20_col3\" class=\"data row20 col3\" >3.8</td>\n",
       "      <td id=\"T_259f0_row20_col4\" class=\"data row20 col4\" >23.1</td>\n",
       "      <td id=\"T_259f0_row20_col5\" class=\"data row20 col5\" >7.6</td>\n",
       "      <td id=\"T_259f0_row20_col6\" class=\"data row20 col6\" >5.6</td>\n",
       "      <td id=\"T_259f0_row20_col7\" class=\"data row20 col7\" >11.4</td>\n",
       "      <td id=\"T_259f0_row20_col8\" class=\"data row20 col8\" >23.5</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_259f0_row21_col0\" class=\"data row21 col0\" >Portugal</td>\n",
       "      <td id=\"T_259f0_row21_col1\" class=\"data row21 col1\" >18.6</td>\n",
       "      <td id=\"T_259f0_row21_col2\" class=\"data row21 col2\" >9.5</td>\n",
       "      <td id=\"T_259f0_row21_col3\" class=\"data row21 col3\" >3.0</td>\n",
       "      <td id=\"T_259f0_row21_col4\" class=\"data row21 col4\" >13.6</td>\n",
       "      <td id=\"T_259f0_row21_col5\" class=\"data row21 col5\" >3.1</td>\n",
       "      <td id=\"T_259f0_row21_col6\" class=\"data row21 col6\" >3.6</td>\n",
       "      <td id=\"T_259f0_row21_col7\" class=\"data row21 col7\" >5.2</td>\n",
       "      <td id=\"T_259f0_row21_col8\" class=\"data row21 col8\" >10.6</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_259f0_row22_col0\" class=\"data row22 col0\" >Romania</td>\n",
       "      <td id=\"T_259f0_row22_col1\" class=\"data row22 col1\" >28.6</td>\n",
       "      <td id=\"T_259f0_row22_col2\" class=\"data row22 col2\" >23.3</td>\n",
       "      <td id=\"T_259f0_row22_col3\" class=\"data row22 col3\" >4.1</td>\n",
       "      <td id=\"T_259f0_row22_col4\" class=\"data row22 col4\" >22.5</td>\n",
       "      <td id=\"T_259f0_row22_col5\" class=\"data row22 col5\" >9.5</td>\n",
       "      <td id=\"T_259f0_row22_col6\" class=\"data row22 col6\" >7.0</td>\n",
       "      <td id=\"T_259f0_row22_col7\" class=\"data row22 col7\" >8.1</td>\n",
       "      <td id=\"T_259f0_row22_col8\" class=\"data row22 col8\" >25.0</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_259f0_row23_col0\" class=\"data row23 col0\" >Slovakia</td>\n",
       "      <td id=\"T_259f0_row23_col1\" class=\"data row23 col1\" >23.1</td>\n",
       "      <td id=\"T_259f0_row23_col2\" class=\"data row23 col2\" >13.0</td>\n",
       "      <td id=\"T_259f0_row23_col3\" class=\"data row23 col3\" >3.6</td>\n",
       "      <td id=\"T_259f0_row23_col4\" class=\"data row23 col4\" >16.0</td>\n",
       "      <td id=\"T_259f0_row23_col5\" class=\"data row23 col5\" >4.6</td>\n",
       "      <td id=\"T_259f0_row23_col6\" class=\"data row23 col6\" >3.0</td>\n",
       "      <td id=\"T_259f0_row23_col7\" class=\"data row23 col7\" >4.9</td>\n",
       "      <td id=\"T_259f0_row23_col8\" class=\"data row23 col8\" >15.5</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_259f0_row24_col0\" class=\"data row24 col0\" >Slovenia</td>\n",
       "      <td id=\"T_259f0_row24_col1\" class=\"data row24 col1\" >24.4</td>\n",
       "      <td id=\"T_259f0_row24_col2\" class=\"data row24 col2\" >11.9</td>\n",
       "      <td id=\"T_259f0_row24_col3\" class=\"data row24 col3\" >3.1</td>\n",
       "      <td id=\"T_259f0_row24_col4\" class=\"data row24 col4\" >18.4</td>\n",
       "      <td id=\"T_259f0_row24_col5\" class=\"data row24 col5\" >7.4</td>\n",
       "      <td id=\"T_259f0_row24_col6\" class=\"data row24 col6\" >4.3</td>\n",
       "      <td id=\"T_259f0_row24_col7\" class=\"data row24 col7\" >7.4</td>\n",
       "      <td id=\"T_259f0_row24_col8\" class=\"data row24 col8\" >16.4</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_259f0_row25_col0\" class=\"data row25 col0\" >Spain</td>\n",
       "      <td id=\"T_259f0_row25_col1\" class=\"data row25 col1\" >20.6</td>\n",
       "      <td id=\"T_259f0_row25_col2\" class=\"data row25 col2\" >11.0</td>\n",
       "      <td id=\"T_259f0_row25_col3\" class=\"data row25 col3\" >2.6</td>\n",
       "      <td id=\"T_259f0_row25_col4\" class=\"data row25 col4\" >17.3</td>\n",
       "      <td id=\"T_259f0_row25_col5\" class=\"data row25 col5\" >6.3</td>\n",
       "      <td id=\"T_259f0_row25_col6\" class=\"data row25 col6\" >3.3</td>\n",
       "      <td id=\"T_259f0_row25_col7\" class=\"data row25 col7\" >6.1</td>\n",
       "      <td id=\"T_259f0_row25_col8\" class=\"data row25 col8\" >15.8</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_259f0_row26_col0\" class=\"data row26 col0\" >Sweden</td>\n",
       "      <td id=\"T_259f0_row26_col1\" class=\"data row26 col1\" >19.8</td>\n",
       "      <td id=\"T_259f0_row26_col2\" class=\"data row26 col2\" >10.2</td>\n",
       "      <td id=\"T_259f0_row26_col3\" class=\"data row26 col3\" >1.9</td>\n",
       "      <td id=\"T_259f0_row26_col4\" class=\"data row26 col4\" >18.1</td>\n",
       "      <td id=\"T_259f0_row26_col5\" class=\"data row26 col5\" >9.7</td>\n",
       "      <td id=\"T_259f0_row26_col6\" class=\"data row26 col6\" >2.0</td>\n",
       "      <td id=\"T_259f0_row26_col7\" class=\"data row26 col7\" >6.3</td>\n",
       "      <td id=\"T_259f0_row26_col8\" class=\"data row26 col8\" >19.1</td>\n",
       "    </tr>\n",
       "    <tr>\n",
       "      <td id=\"T_259f0_row27_col0\" class=\"data row27 col0\" >European Union</td>\n",
       "      <td id=\"T_259f0_row27_col1\" class=\"data row27 col1\" >20.9</td>\n",
       "      <td id=\"T_259f0_row27_col2\" class=\"data row27 col2\" >12.1</td>\n",
       "      <td id=\"T_259f0_row27_col3\" class=\"data row27 col3\" >2.9</td>\n",
       "      <td id=\"T_259f0_row27_col4\" class=\"data row27 col4\" >16.7</td>\n",
       "      <td id=\"T_259f0_row27_col5\" class=\"data row27 col5\" >7.0</td>\n",
       "      <td id=\"T_259f0_row27_col6\" class=\"data row27 col6\" >3.9</td>\n",
       "      <td id=\"T_259f0_row27_col7\" class=\"data row27 col7\" >6.9</td>\n",
       "      <td id=\"T_259f0_row27_col8\" class=\"data row27 col8\" >17.1</td>\n",
       "    </tr>\n",
       "  </tbody>\n",
       "</table>\n"
      ],
      "text/plain": [
       "<pandas.io.formats.style.Styler at 0x1b50757c090>"
      ]
     },
     "execution_count": 28,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "#| label: tbl-classstage2\n",
    "#| tbl-cap: Pillar classification results (%)\n",
    "tbl04_total.style.hide(axis=\"index\").format(precision=1)"
   ]
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.11.9"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 2
}