Spaces:

neural-thinker
/

cidadao.ai-backend

Paused

anderson-ufrj commited on Oct 2

Commit

adf8d4f

1 Parent(s): 47a6c2b

test(service): add unit tests for dados.gov.br service layer

- Test transparency dataset search with caching
- Test government spending and procurement searches
- Test data availability analysis functionality
- Test organization listing and sorting
- Cover error handling and cleanup operations

Files changed (1) hide show

tests/unit/services/test_dados_gov_service.py +347 -0

tests/unit/services/test_dados_gov_service.py ADDED Viewed

	@@ -0,0 +1,347 @@

+"""
+Unit tests for dados.gov.br service.
+"""
+import pytest
+from unittest.mock import AsyncMock, patch, MagicMock
+from src.services.dados_gov_service import DadosGovService
+from src.tools.dados_gov_api import DadosGovAPIError
+from src.tools.dados_gov_models import (
+    Dataset,
+    DatasetSearchResult,
+    Organization,
+    Resource,
+)
+@pytest.fixture
+def dados_gov_service():
+    """Create service instance for testing"""
+    return DadosGovService(api_key="test-key")
+@pytest.fixture
+def mock_api_client():
+    """Create mock API client"""
+    return AsyncMock()
+@pytest.fixture
+def mock_cache_service():
+    """Create mock cache service"""
+    mock = AsyncMock()
+    mock.get = AsyncMock(return_value=None)
+    mock.set = AsyncMock()
+    return mock
+@pytest.fixture
+def sample_dataset():
+    """Create sample dataset for testing"""
+    return {
+        "id": "test-dataset",
+        "name": "test-dataset",
+        "title": "Test Dataset",
+        "notes": "This is a test dataset",
+        "organization": {
+            "id": "test-org",
+            "name": "test-org",
+            "title": "Test Organization",
+        },
+        "resources": [
+            {
+                "id": "resource1",
+                "package_id": "test-dataset",
+                "name": "data.csv",
+                "format": "CSV",
+                "url": "http://example.com/data.csv",
+            }
+        ],
+        "tags": [
+            {"name": "test-tag"},
+        ],
+    }
+class TestDadosGovService:
+    """Test suite for dados.gov.br service"""
+    @pytest.mark.asyncio
+    async def test_search_transparency_datasets(
+        self,
+        dados_gov_service,
+        mock_api_client,
+        mock_cache_service,
+    ):
+        """Test searching transparency datasets"""
+        # Mock API response
+        mock_api_client.search_datasets.return_value = {
+            "count": 1,
+            "results": [sample_dataset()],
+            "facets": {},
+            "search_facets": {},
+        }
+        dados_gov_service.client = mock_api_client
+        dados_gov_service.cache = mock_cache_service
+        # Search with keywords
+        result = await dados_gov_service.search_transparency_datasets(
+            keywords=["gastos", "contratos"],
+            limit=20,
+        )
+        assert isinstance(result, DatasetSearchResult)
+        assert result.count == 1
+        assert len(result.results) == 1
+        assert result.results[0].id == "test-dataset"
+        # Verify API call
+        mock_api_client.search_datasets.assert_called_once()
+        call_args = mock_api_client.search_datasets.call_args
+        assert "gastos OR contratos" in call_args[1]["query"]
+        # Verify cache usage
+        mock_cache_service.get.assert_called_once()
+        mock_cache_service.set.assert_called_once()
+    @pytest.mark.asyncio
+    async def test_search_transparency_datasets_cached(
+        self,
+        dados_gov_service,
+        mock_cache_service,
+    ):
+        """Test searching with cached results"""
+        # Mock cached data
+        cached_data = {
+            "count": 1,
+            "results": [sample_dataset()],
+            "facets": {},
+            "search_facets": {},
+        }
+        mock_cache_service.get.return_value = cached_data
+        dados_gov_service.cache = mock_cache_service
+        result = await dados_gov_service.search_transparency_datasets()
+        assert result.count == 1
+        # API should not be called when cache hit
+        assert not hasattr(dados_gov_service.client, "search_datasets")
+    @pytest.mark.asyncio
+    async def test_get_dataset_with_resources(
+        self,
+        dados_gov_service,
+        mock_api_client,
+        mock_cache_service,
+    ):
+        """Test getting dataset with resources"""
+        mock_api_client.get_dataset.return_value = {
+            "result": sample_dataset(),
+        }
+        dados_gov_service.client = mock_api_client
+        dados_gov_service.cache = mock_cache_service
+        result = await dados_gov_service.get_dataset_with_resources("test-dataset")
+        assert isinstance(result, Dataset)
+        assert result.id == "test-dataset"
+        assert len(result.resources) == 1
+        assert result.resources[0].format == "CSV"
+        mock_api_client.get_dataset.assert_called_once_with("test-dataset")
+    @pytest.mark.asyncio
+    async def test_find_government_spending_data(
+        self,
+        dados_gov_service,
+        mock_api_client,
+        mock_cache_service,
+    ):
+        """Test finding government spending data"""
+        # Create relevant dataset
+        spending_dataset = sample_dataset()
+        spending_dataset["title"] = "Gastos Públicos 2023"
+        spending_dataset["notes"] = "Dados de despesas do governo"
+        mock_api_client.search_datasets.return_value = {
+            "count": 1,
+            "results": [spending_dataset],
+        }
+        dados_gov_service.client = mock_api_client
+        dados_gov_service.cache = mock_cache_service
+        result = await dados_gov_service.find_government_spending_data(
+            year=2023,
+            state="SP",
+        )
+        assert len(result) == 1
+        assert "Gastos" in result[0].title
+        # Verify search query includes year and state
+        call_args = mock_api_client.search_datasets.call_args
+        query = call_args[1]["query"]
+        assert "2023" in query
+        assert "SP" in query
+    @pytest.mark.asyncio
+    async def test_find_procurement_data(
+        self,
+        dados_gov_service,
+        mock_api_client,
+        mock_cache_service,
+    ):
+        """Test finding procurement data"""
+        procurement_dataset = sample_dataset()
+        procurement_dataset["title"] = "Licitações e Contratos"
+        mock_api_client.search_datasets.return_value = {
+            "count": 1,
+            "results": [procurement_dataset],
+        }
+        dados_gov_service.client = mock_api_client
+        dados_gov_service.cache = mock_cache_service
+        result = await dados_gov_service.find_procurement_data(
+            modality="pregão",
+        )
+        assert len(result) == 1
+        assert result[0].title == "Licitações e Contratos"
+    @pytest.mark.asyncio
+    async def test_analyze_data_availability(
+        self,
+        dados_gov_service,
+        mock_api_client,
+        mock_cache_service,
+    ):
+        """Test analyzing data availability"""
+        # Create datasets with different characteristics
+        datasets = [
+            {
+                **sample_dataset(),
+                "title": "Educação Básica 2023",
+                "organization": {"title": "MEC"},
+                "resources": [
+                    {"format": "CSV"},
+                    {"format": "JSON"},
+                ],
+            },
+            {
+                **sample_dataset(),
+                "id": "dataset2",
+                "title": "Dados Educacionais Estaduais 2022",
+                "organization": {"title": "Secretaria Estadual"},
+                "resources": [
+                    {"format": "CSV"},
+                ],
+            },
+        ]
+        mock_api_client.search_datasets.return_value = {
+            "count": 2,
+            "results": datasets,
+        }
+        dados_gov_service.client = mock_api_client
+        dados_gov_service.cache = mock_cache_service
+        analysis = await dados_gov_service.analyze_data_availability("educação")
+        assert analysis["topic"] == "educação"
+        assert analysis["total_datasets"] == 2
+        assert analysis["analyzed_datasets"] == 2
+        assert "MEC" in analysis["organizations"]
+        assert analysis["organizations"]["MEC"] == 1
+        assert "CSV" in analysis["formats"]
+        assert analysis["formats"]["CSV"] == 2
+        assert "JSON" in analysis["formats"]
+        assert analysis["formats"]["JSON"] == 1
+        assert "2022" in analysis["years_covered"]
+        assert "2023" in analysis["years_covered"]
+    @pytest.mark.asyncio
+    async def test_get_resource_download_url(
+        self,
+        dados_gov_service,
+        mock_api_client,
+    ):
+        """Test getting resource download URL"""
+        mock_api_client.get_resource.return_value = {
+            "result": {
+                "id": "resource1",
+                "url": "http://example.com/data.csv",
+            }
+        }
+        dados_gov_service.client = mock_api_client
+        url = await dados_gov_service.get_resource_download_url("resource1")
+        assert url == "http://example.com/data.csv"
+        mock_api_client.get_resource.assert_called_once_with("resource1")
+    @pytest.mark.asyncio
+    async def test_list_government_organizations(
+        self,
+        dados_gov_service,
+        mock_api_client,
+        mock_cache_service,
+    ):
+        """Test listing government organizations"""
+        orgs_data = [
+            {"id": "org1", "title": "Organization 1", "package_count": 100},
+            {"id": "org2", "title": "Organization 2", "package_count": 50},
+            {"id": "org3", "title": "Organization 3", "package_count": 150},
+        ]
+        mock_api_client.list_organizations.return_value = {
+            "result": orgs_data,
+        }
+        dados_gov_service.client = mock_api_client
+        dados_gov_service.cache = mock_cache_service
+        result = await dados_gov_service.list_government_organizations()
+        assert len(result) == 3
+        # Should be sorted by package count
+        assert result[0].package_count == 150
+        assert result[1].package_count == 100
+        assert result[2].package_count == 50
+    @pytest.mark.asyncio
+    async def test_error_handling(
+        self,
+        dados_gov_service,
+        mock_api_client,
+        mock_cache_service,
+    ):
+        """Test error handling from API"""
+        mock_api_client.search_datasets.side_effect = DadosGovAPIError(
+            "API Error",
+            status_code=500,
+        )
+        dados_gov_service.client = mock_api_client
+        dados_gov_service.cache = mock_cache_service
+        with pytest.raises(DadosGovAPIError):
+            await dados_gov_service.search_transparency_datasets()
+    @pytest.mark.asyncio
+    async def test_service_cleanup(self, dados_gov_service):
+        """Test service cleanup"""
+        mock_client = AsyncMock()
+        dados_gov_service.client = mock_client
+        await dados_gov_service.close()
+        mock_client.close.assert_called_once()